「Scikit-Learnによるアンサンブル学習:フレンドリーな紹介」

Scikit-Learnのアンサンブル学習のフレンドリーな紹介

XGBoostやランダムフォレストなどのアンサンブル学習アルゴリズムは、Kaggleのコンペティションでトップのパフォーマンスを示しています。それらはどのように機能するのでしょうか?

Source: unsplash.com

ロジスティック回帰や線形回帰などの基本的な学習アルゴリズムは、機械学習の問題に適切な結果を得るにはあまりにも単純すぎます。ニューラルネットワークを使用するという解決策もありますが、それにはほとんど利用できないほどの大量のトレーニングデータが必要です。アンサンブル学習技術を使用すると、限られた量のデータでも単純なモデルのパフォーマンスを向上させることができます。

大きな瓶の中にいくつのジェリービーンズが入っているかを人に推測してもらうと想像してください。一人の人の回答は正確な推定値とは限りません。代わりに、同じ質問を千人にすると、平均的な回答は実際の数値に近いものになるでしょう。これを「群衆の知恵」と呼びます[1]。複雑な推定課題に取り組む際には、群衆は個人よりもはるかに正確な場合があります。

アンサンブル学習アルゴリズムは、回帰器や分類器などのモデルの予測を集約することで、この単純な原理を利用します。分類器の集約では、アンサンブルモデルは低レベル分類器の予測の中で最も一般的なクラスを選ぶことができます。代わりに、回帰タスクでは予測の平均値や中央値を使用することができます。

Image by the author.

多数の弱い学習者、つまりランダムな推測よりもわずかに優れた分類器や回帰器を集約することで、信じられない結果を得ることができます。2値分類のタスクを考えてみましょう。個々の精度が51%である1000の独立した分類器を集約することにより、精度が75%のアンサンブルを作成することができます[2]。

これがなぜアンサンブルアルゴリズムが多くの機械学習コンペティションで勝利する理由です!

アンサンブル学習アルゴリズムを構築するためのいくつかの技術が存在します。主なものはバギング、ブースティング、スタッキングです。以下に続きます…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「機械学習が間違いを comitte たとき、それはどういう意味ですか?」

「ML/AIに関する議論で、私たちの通常の「ミステイク(間違い)」の定義は意味をなすでしょうか?もしそうでない場合、なぜで...

AI研究

「CMUの研究者がBUTD-DETRを導入:言語発話に直接依存し、発話で言及されるすべてのオブジェクトを検出する人工知能(AI)モデル」

画像内のすべての「オブジェクト」を見つけることは、コンピュータビジョンの基礎です。カテゴリの語彙を作成し、この語彙の...

AIニュース

「RBIは、Conversational AIとオフライン決済の使用をUPIで採用する」

デジタル決済において新たな地平を切り開くため、インド準備銀行(RBI)は高度な統合支払いインターフェース(UPI)の機能を...

データサイエンス

「拡散を通じた適応学習:先進のパラダイム」

イントロダクション 教育と機械学習のダイナミックな風景において、適応学習を通じた拡散はパラダイムシフトを示しています。...

機械学習

自然言語処理:BERTやGPTを超えて

技術の世界は常に進化しており、その中でも特に進歩が見られる分野の一つが自然言語処理(NLP)です数年前には、BERTとGPTと...

データサイエンス

自然言語処理のタクソノミー

「異なる研究分野と最近の自然言語処理(NLP)の進展の概要」