「本当にあのキノコを食べるべきか?」

「あのキノコを食べるべきか?」

CatBoost勾配ブースティング決定木を使った食用と有毒なキノコの分類

ほとんどの教育および実世界のデータセットにはカテゴリカルな特徴が含まれています。今日は、カテゴリカルデータのネイティブサポートを提供するCatBoostライブラリから勾配ブースティング決定木を取り上げます。食用または有毒なキノコのデータセットを使用します。キノコは色、匂い、形状などのカテゴリカルな特徴で説明されており、私たちが答えたい質問は次のとおりです:

このキノコは安全に食べられるでしょうか — カテゴリカルな特徴に基づいて?

ご覧の通り、賭けは大きいです。私たちは機械学習モデルを正しく作成して、キノコオムレツが災害に終わらないようにしたいのです。 ボーナスとして、最後にカテゴリカルな特徴の重要度ランキングを提供します。これにより、キノコの安全性の最も強力な予測子がわかります。

Andrew Ridley氏による写真

キノコデータセットの紹介

キノコデータセットはこちらで入手できます:https://archive.ics.uci.edu/dataset/73/mushroom [1]。プレゼンテーションの明確さのために、元の難解な省略形の変数からpandasのDataFrameを作成し、適切な列名と長い形式の変数で注釈を付けます。データセットの説明から取得した長い形式の変数をpandasのreplace関数に使用します。ターゲット変数はTrueとFalseの値のみを取ることができます — データセット作成者は疑問のあるキノコを食べられないと分類しました。

欠損値のあるデータセットをチェックした結果、1つの列、stalk_rootだけが影響を受けていることがわかりました。この列を削除します。

データセットの探索により、データがかなりバランスしていることがわかります:8124個のキノコのうち、4208個は…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「ジンディのCEO兼共同創設者、セリーナ・リー― インタビューシリーズ」

「Celina Leeは、ZindiのCEO兼共同創設者であり、アフリカのデータサイエンティスト向けの最大の専門ネットワークです Celina...

人工知能

「UVeyeの共同設立者兼CEO、アミール・ヘヴェルについてのインタビューシリーズ」

アミール・ヘヴァーは、UVeyeのCEO兼共同創設者であり、高速かつ正確な異常検出により、自動車およびセキュリティ産業に直面...

人工知能

ベイリー・カクスマー、ウォータールー大学の博士課程候補 - インタビューシリーズ

カツマー・ベイリーは、ウォータールー大学のコンピュータ科学学部の博士課程の候補者であり、アルバータ大学の新入教員です...

機械学習

「機械学習 vs AI vs ディープラーニング vs ニューラルネットワーク:違いは何ですか?」

テクノロジーの急速な進化は、ビジネスが効率化のために洗練されたアルゴリズムにますます頼ることで、私たちの日常生活を形...

人工知能

「シフトのCEOであるクリス・ナーゲル – インタビューシリーズ」

クリスはSiftの最高経営責任者です彼は、Ping Identityを含むベンチャー支援および公開SaaS企業のシニアリーダーシップポジシ...

AIテクノロジー

「LXTのテクノロジーバイスプレジデント、アムル・ヌール・エルディン - インタビューシリーズ」

アムル・ヌール・エルディンは、LXTのテクノロジー担当副社長ですアムルは、自動音声認識(ASR)の文脈での音声/音響処理と機...