「3年間の経験から厳選された130の機械学習のテクニックとリソース(さらに無料のeBookも含む)」
130 selected machine learning techniques and resources from 3 years of experience (including a free eBook)
それぞれの記事はあなたの時間に値する
イントロダクション
データサイエンスと機械学習には、二種類のトリックがあります。一つは珍しくてとてもクールなトリックです。それらはあなたの注意を引くために設計されていますが、最終的には使用しないでしょう。なぜなら、それらの使用ケースがあまりにも狭いからです。可読性の点でひどいPythonの1行コードを思い浮かべてください。
二つ目のカテゴリには、珍しくてクールで非常に有用なトリックがあります。これらはすぐにあなたの仕事で使い始めるでしょう。
私はデータに関する3年間の旅を通じて、二つ目のカテゴリに属する100以上のトリックとリソースを収集し、オンラインブック「Tricking Data Science」にまとめました(一部は時々一つ目のカテゴリと重なるかもしれません)。
オンラインブックには200以上のアイテムがあり、きちんと整理されていますが、VoAGIではより良い読書体験を提供するために、その中から最も優れた130を一つの記事にまとめました。
お楽しみください!
もしもフル記事を読むことなく、オンラインブックにジャンプしたい場合には、50回拍手してから私をフォローしてください 🙂
トリック
1. ELI5を使った順列重要度
順列重要度は、モデル内の重要な特徴を見るための最も信頼性の高い方法の一つです。
その利点:
- どのようなモデル構造でも動作します
- 解釈と実装が容易です
- 一貫性があり信頼性があります
特徴の順列重要度は、その特徴をランダムにシャッフルした場合のモデルの性能の変化として定義されます。
順列重要度はeli5パッケージを介して利用できます。以下はXGBoost Regressorモデルの順列重要度スコアです👇
show_weights関数は、シャッフル後にモデルの性能に最も影響を与える特徴を表示します。つまり、最も重要な特徴です。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles