「3年間の経験から厳選された130の機械学習のテクニックとリソース(さらに無料のeBookも含む)」

130 selected machine learning techniques and resources from 3 years of experience (including a free eBook)

それぞれの記事はあなたの時間に値する

Midjourneyで作成した私の画像。他のすべての画像とGIFは、別に指定しない限り私が作成しました。

イントロダクション

データサイエンスと機械学習には、二種類のトリックがあります。一つは珍しくてとてもクールなトリックです。それらはあなたの注意を引くために設計されていますが、最終的には使用しないでしょう。なぜなら、それらの使用ケースがあまりにも狭いからです。可読性の点でひどいPythonの1行コードを思い浮かべてください。

二つ目のカテゴリには、珍しくてクールで非常に有用なトリックがあります。これらはすぐにあなたの仕事で使い始めるでしょう。

私はデータに関する3年間の旅を通じて、二つ目のカテゴリに属する100以上のトリックとリソースを収集し、オンラインブック「Tricking Data Science」にまとめました(一部は時々一つ目のカテゴリと重なるかもしれません)。

オンラインブックには200以上のアイテムがあり、きちんと整理されていますが、VoAGIではより良い読書体験を提供するために、その中から最も優れた130を一つの記事にまとめました。

お楽しみください!

もしもフル記事を読むことなく、オンラインブックにジャンプしたい場合には、50回拍手してから私をフォローしてください 🙂

トリック

1. ELI5を使った順列重要度

順列重要度は、モデル内の重要な特徴を見るための最も信頼性の高い方法の一つです。

その利点:

  1. どのようなモデル構造でも動作します
  2. 解釈と実装が容易です
  3. 一貫性があり信頼性があります

特徴の順列重要度は、その特徴をランダムにシャッフルした場合のモデルの性能の変化として定義されます。

順列重要度はeli5パッケージを介して利用できます。以下はXGBoost Regressorモデルの順列重要度スコアです👇

show_weights関数は、シャッフル後にモデルの性能に最も影響を与える特徴を表示します。つまり、最も重要な特徴です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

ピーター・マッキー、Sonarの開発者担当責任者-インタビューシリーズ

ピーター・マッキーはSonarのDeveloper Relationsの責任者です Sonarは、悪いコードの1兆ドルの課題を解決するプラットフォー...

人工知能

Diginiのスマートセンスの社長、ガイ・イエヒアブによるインタビューシリーズ

ガイ・イハイアヴ氏は、ビジネスの成功に最も重要な資産を保護するためにインターネット・オブ・シングス(IoT)の力を活用す...

人工知能

「Ami Hever、UVeyeの共同創設者兼CEO - インタビューシリーズ」

עמיר חבר הוא המנכל והמייסד של UVeye, סטארט-אפ ראיה ממוחשבת בלמידה עמוקה, המציבה את התקן הגלובלי לבדיקת רכבים עם זיהוי...

機械学習

3つの質問:大規模言語モデルについて、Jacob Andreasに聞く

CSAILの科学者は、最新の機械学習モデルを通じた自然言語処理の研究と、言語が他の種類の人工知能をどのように高めるかの調査...

人工知能

「コマンドバーの創設者兼CEO、ジェームズ・エバンスによるインタビューシリーズ」

ジェームズ・エバンズは、CommandBarの創設者兼CEOであり、製品、マーケティング、顧客チームを支援するために設計されたAIパ...

データサイエンス

「David Smith、TheVentureCityの最高データオフィサー- インタビューシリーズ」

デビッド・スミス(別名「デビッド・データ」)は、TheVentureCityのチーフデータオフィサーであり、ソフトウェア駆動型のス...