「本当にあのキノコを食べるべきか?」

「あのキノコを食べるべきか?」

CatBoost勾配ブースティング決定木を使った食用と有毒なキノコの分類

ほとんどの教育および実世界のデータセットにはカテゴリカルな特徴が含まれています。今日は、カテゴリカルデータのネイティブサポートを提供するCatBoostライブラリから勾配ブースティング決定木を取り上げます。食用または有毒なキノコのデータセットを使用します。キノコは色、匂い、形状などのカテゴリカルな特徴で説明されており、私たちが答えたい質問は次のとおりです:

このキノコは安全に食べられるでしょうか — カテゴリカルな特徴に基づいて?

ご覧の通り、賭けは大きいです。私たちは機械学習モデルを正しく作成して、キノコオムレツが災害に終わらないようにしたいのです。 ボーナスとして、最後にカテゴリカルな特徴の重要度ランキングを提供します。これにより、キノコの安全性の最も強力な予測子がわかります。

Andrew Ridley氏による写真

キノコデータセットの紹介

キノコデータセットはこちらで入手できます:https://archive.ics.uci.edu/dataset/73/mushroom [1]。プレゼンテーションの明確さのために、元の難解な省略形の変数からpandasのDataFrameを作成し、適切な列名と長い形式の変数で注釈を付けます。データセットの説明から取得した長い形式の変数をpandasのreplace関数に使用します。ターゲット変数はTrueとFalseの値のみを取ることができます — データセット作成者は疑問のあるキノコを食べられないと分類しました。

欠損値のあるデータセットをチェックした結果、1つの列、stalk_rootだけが影響を受けていることがわかりました。この列を削除します。

データセットの探索により、データがかなりバランスしていることがわかります:8124個のキノコのうち、4208個は…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「Ntropyの共同創設者兼CEO、ナレ・ヴァルダニアンについて - インタビューシリーズ」

「Ntropyの共同創設者兼CEOであるナレ・ヴァルダニアンは、超人的な精度で100ミリ秒以下で金融取引を解析することを可能にす...

人工知能

「Zenの共同創設者兼CTO、イオン・アレクサンドル・セカラ氏によるインタビューシリーズ」

創業者兼CTOであるIon-Alexandru Secaraは、Zen(PostureHealth Inc.)の開発を牽引しており、画期的な姿勢矯正ソフトウェア...

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...

人工知能

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ジョナサン・ダムブロットは、Cranium AIのCEO兼共同創業者ですCranium AIは、サイバーセキュリティおよびデータサイエンスチ...

人工知能

「ジンディのCEO兼共同創設者、セリーナ・リー― インタビューシリーズ」

「Celina Leeは、ZindiのCEO兼共同創設者であり、アフリカのデータサイエンティスト向けの最大の専門ネットワークです Celina...

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...