「Scikit-Learnによるアンサンブル学習:フレンドリーな紹介」

Scikit-Learnのアンサンブル学習のフレンドリーな紹介

XGBoostやランダムフォレストなどのアンサンブル学習アルゴリズムは、Kaggleのコンペティションでトップのパフォーマンスを示しています。それらはどのように機能するのでしょうか?

Source: unsplash.com

ロジスティック回帰や線形回帰などの基本的な学習アルゴリズムは、機械学習の問題に適切な結果を得るにはあまりにも単純すぎます。ニューラルネットワークを使用するという解決策もありますが、それにはほとんど利用できないほどの大量のトレーニングデータが必要です。アンサンブル学習技術を使用すると、限られた量のデータでも単純なモデルのパフォーマンスを向上させることができます。

大きな瓶の中にいくつのジェリービーンズが入っているかを人に推測してもらうと想像してください。一人の人の回答は正確な推定値とは限りません。代わりに、同じ質問を千人にすると、平均的な回答は実際の数値に近いものになるでしょう。これを「群衆の知恵」と呼びます[1]。複雑な推定課題に取り組む際には、群衆は個人よりもはるかに正確な場合があります。

アンサンブル学習アルゴリズムは、回帰器や分類器などのモデルの予測を集約することで、この単純な原理を利用します。分類器の集約では、アンサンブルモデルは低レベル分類器の予測の中で最も一般的なクラスを選ぶことができます。代わりに、回帰タスクでは予測の平均値や中央値を使用することができます。

Image by the author.

多数の弱い学習者、つまりランダムな推測よりもわずかに優れた分類器や回帰器を集約することで、信じられない結果を得ることができます。2値分類のタスクを考えてみましょう。個々の精度が51%である1000の独立した分類器を集約することにより、精度が75%のアンサンブルを作成することができます[2]。

これがなぜアンサンブルアルゴリズムが多くの機械学習コンペティションで勝利する理由です!

アンサンブル学習アルゴリズムを構築するためのいくつかの技術が存在します。主なものはバギング、ブースティング、スタッキングです。以下に続きます…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

AI導入の迷宮を進む

「過去5年間、複数の企業と協力し、彼らがAIソリューションを展開するのを支援してきましたその過程で、いくつかの共通のパタ...

機械学習

「OpenAIは、パーソナライズされたAIインタラクションのためのChatGPTのカスタムインストラクションを開始」

OpenAIは、AI言語モデルChatGPTのユーザーコントロールを向上させるために、新しい機能「カスタムインストラクション」を導入...

機械学習

この人工知能論文は、画像認識における差分プライバシーの高度な手法を提案し、より高い精度をもたらします

機械学習は、近年のパフォーマンスにより、さまざまな領域で大幅に増加しました。現代のコンピュータの計算能力とグラフィッ...

データサイエンス

「Langchainとは何ですか?そして、大規模言語モデルとは何ですか?」

この包括的な記事では、LangChainとLarge Language Modelsの両方を探求します両方を理解するために、簡単なチュートリアルを...

人工知能

「もしスローガンが真実だったら(ChatGPTによると)」

「私たちはChatGPTに、世界最大の企業のスローガンを再現するように依頼しました今回は、彼らは真実を伝えなければなりません...

データサイエンス

AIの力 なぜウェブ開発者はまだ絶対的な存在なのか

AIは今日の流行語です多くのソフトウェア会社が開発中にそれを使用していますが、みんな同じことを言っていますAIは開発者を...