「3年間の経験から厳選された130の機械学習のテクニックとリソース（さらに無料のeBookも含む）」

130 selected machine learning techniques and resources from 3 years of experience (including a free eBook)

それぞれの記事はあなたの時間に値する

Midjourneyで作成した私の画像。他のすべての画像とGIFは、別に指定しない限り私が作成しました。

イントロダクション

データサイエンスと機械学習には、二種類のトリックがあります。一つは珍しくてとてもクールなトリックです。それらはあなたの注意を引くために設計されていますが、最終的には使用しないでしょう。なぜなら、それらの使用ケースがあまりにも狭いからです。可読性の点でひどいPythonの1行コードを思い浮かべてください。

二つ目のカテゴリには、珍しくてクールで非常に有用なトリックがあります。これらはすぐにあなたの仕事で使い始めるでしょう。

私はデータに関する3年間の旅を通じて、二つ目のカテゴリに属する100以上のトリックとリソースを収集し、オンラインブック「Tricking Data Science」にまとめました（一部は時々一つ目のカテゴリと重なるかもしれません）。

オンラインブックには200以上のアイテムがあり、きちんと整理されていますが、VoAGIではより良い読書体験を提供するために、その中から最も優れた130を一つの記事にまとめました。

お楽しみください！

もしもフル記事を読むことなく、オンラインブックにジャンプしたい場合には、50回拍手してから私をフォローしてください 🙂

トリック

1. ELI5を使った順列重要度

順列重要度は、モデル内の重要な特徴を見るための最も信頼性の高い方法の一つです。

その利点：

どのようなモデル構造でも動作します
解釈と実装が容易です
一貫性があり信頼性があります

特徴の順列重要度は、その特徴をランダムにシャッフルした場合のモデルの性能の変化として定義されます。

順列重要度はeli5パッケージを介して利用できます。以下はXGBoost Regressorモデルの順列重要度スコアです👇

show_weights関数は、シャッフル後にモデルの性能に最も影響を与える特徴を表示します。つまり、最も重要な特徴です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

「3年間の経験から厳選された130の機械学習のテクニックとリソース（さらに無料のeBookも含む）」

それぞれの記事はあなたの時間に値する

イントロダクション

トリック

1. ELI5を使った順列重要度

Was this article helpful?

CDPとAIの交差点：人工知能が顧客データプラットフォームを革新する方法

時系列予測における相互作用項に関する包括的なガイド

人工知能

「Kognitosの創設者兼CEO、ビニー・ギル- インタビューシリーズ」

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか？

「2023年にデータサイエンスFAANGの仕事をゲットする方法は？」

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ベイリー・カクスマー、ウォータールー大学の博士課程候補 - インタビューシリーズ

Diginiのスマートセンスの社長、ガイ・イエヒアブによるインタビューシリーズ