「理論から実践への勾配ブースティング(パート2)」

Gradient Boosting from Theory to Practice (Part 2)

Scikit-Learnを使用して、異なる分類および回帰問題を解決するために勾配ブースティングクラスを使用する

UnsplashのLuca Bravoによる写真

この記事の最初の部分では、勾配ブースティングアルゴリズムを紹介し、擬似コードでの実装を示しました。

この記事のこの部分では、このアルゴリズムを実装するScikit-Learnのクラスを探求し、さまざまなパラメータを説明し、いくつかの分類および回帰問題を解決する方法を示します。

より最適化された高スケーラビリティを備えたgradient boostingの実装を提供するXGBoostライブラリ(将来の記事でカバーされます)に比べて、小〜VoAGIサイズのデータセットでは、Scikit-Learnの勾配ブースティングクラスを使用する方が簡単であり、インターフェースもシンプルでチューニングするハイパーパラメータの数もはるかに少ないことがよくあります。

Scikit-Learnにおける勾配ブースティング

Scikit-Learnは、勾配ブースティング決定木(GBDT)モデルを実装する以下のクラスを提供しています:

  1. GradientBoostingClassifierは分類問題に使用されます。
  2. GradientBoostingRegressorは回帰問題に使用されます。

決定木の標準的なパラメータ(criterion、max_depth(デフォルトは3)、min_samples_splitなど)に加えて、これらのクラスは以下のパラメータを提供します:

  1. loss — 最適化される損失関数です。GradientBoostingClassifierでは、この関数は「log_loss」(デフォルト)または「exponential」(勾配ブースティングをAdaBoostアルゴリズムのように動作させる)になります。GradientBoostingRegressorでは、この関数は「squared_loss」(デフォルト)、「absolute_loss」、「huber」、または「quantile」になります。
  2. n_estimators — ブースティングの反復回数です(デフォルトは100)。
  3. learning_rate — 各木の寄与を縮小する係数です(デフォルトは0.1)。
  4. subsample — 各木のトレーニングに使用するサンプルの割合です(デフォルトは1.0)。
  5. max_features — 各ノードで最適な分割を探索する際に考慮する特徴量の数です。オプションは、整数を指定することです…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIテクノロジー

「LXTのテクノロジーバイスプレジデント、アムル・ヌール・エルディン - インタビューシリーズ」

アムル・ヌール・エルディンは、LXTのテクノロジー担当副社長ですアムルは、自動音声認識(ASR)の文脈での音声/音響処理と機...

人工知能

「アナコンダのCEO兼共同創業者、ピーターウォングによるインタビューシリーズ」

ピーター・ワンはAnacondaのCEO兼共同創設者ですAnaconda(以前はContinuum Analyticsとして知られる)を設立する前は、ピー...

人工知能

「ElaiのCEO&共同創業者、Vitalii Romanchenkoについてのインタビューシリーズ」

ヴィタリー・ロマンチェンコは、ElaiのCEO兼共同創設者であり、マイク、カメラ、俳優、スタジオの必要なく、個人が一流のビデ...

人工知能

「Ntropyの共同創設者兼CEO、ナレ・ヴァルダニアンについて - インタビューシリーズ」

「Ntropyの共同創設者兼CEOであるナレ・ヴァルダニアンは、超人的な精度で100ミリ秒以下で金融取引を解析することを可能にす...

人工知能

「UVeyeの共同設立者兼CEO、アミール・ヘヴェルについてのインタビューシリーズ」

アミール・ヘヴァーは、UVeyeのCEO兼共同創設者であり、高速かつ正確な異常検出により、自動車およびセキュリティ産業に直面...

人工知能

エンテラソリューションズの創設者兼CEO、スティーブン・デアンジェリス- インタビューシリーズ

スティーブン・デアンジェリスは、エンタラソリューションズの創設者兼CEOであり、自律的な意思決定科学(ADS®)技術を用いて...