分類器のアンサンブル:投票分類器
分類器のアンサンブル:投票分類器
さまざまなモデルを組み合わせてより良い予測を行う
MLの文脈でのアンサンブルとは、同じタスクのために訓練された有限な数のMLモデル(ANNを含む場合もあります)のコレクションを指します。通常、モデルは独立して訓練され、その予測が組み合わされます。
異なるモデルの予測が異なる場合、個々の分類器よりもアンサンブルを使用して分類する方が有用な場合があります。ここでは、異なる分類器を組み合わせてアンサンブルを作成し、そのアンサンブルを予測タスクに使用したいと思います。この記事では以下が議論されます。
- SklearnのVotingClassifierを使用してアンサンブルを構築する。
- VotingClassifierのハードボーティングとソフトボーティングとは何か。
- VotingClassifierで個々のモデルの性能をチェックする。
- 最終的には、GridSearchCV + VotingClassifierを使用して個々のモデルの最適なパラメータを見つける。
さあ、始めましょう!
データの準備:
VotingClassifierの実際の例を見るために、心不全予測データセット(オープンデータベースライセンスで利用可能)を使用しています。ここでは、特定の属性を持つ患者が心臓疾患を持っているかどうかを予測するための2値分類が課題です。データセットには、900人以上の患者の年齢、性別、安静時血圧など、10の属性が含まれています。さまざまなパラメータのいくつかの分布をチェックしてみましょう。’ClassLabel’の数(1は心臓疾患を示し、0は健康を示します)を、性別の関数としてチェックします。
- 最適なチャートを選ぶことで、洞察を最大化しましょう:ネットワーク、ヒートマップ、またはサンキーダイアグラム?
- 「AIは個人の知識管理をどのように変革しているのか?」
- 「Pythonプロジェクトを保護する:究極のコードセキュリティのために直接setup.pyの呼び出しを避ける!」
一般的には、男性の方が女性よりも病気の割合が高いことがわかります。また、コレステロールと安静時血圧のような個々の特徴もチェックできます。以下に示すように、コレステロールと安静時血圧は病気の患者では高く、特に女性の場合に顕著です。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles