「精度と再現率を超えて:Tversky指数に深く潜る」

Beyond Accuracy and Recall Delving Deep into the Tversky Index

代替の分類指標の探索

写真:Ricardo Arceさん撮影、Unsplashより

データサイエンスの世界では、指標はモデルを成功に導くコンパスです。多くの人は精度と再現率という古典的な指標について知っていますが、実は他にも試す価値のあるさまざまなオプションがあります。

この記事では、Tversky指数について掘り下げていきます。この指標は、Dice係数とJaccard係数の一般化であり、精度と再現率をバランスさせる際に非常に役立ちます。ニューラルネットワークの損失関数として実装すると、クラスの不均衡に対処するための強力な手段となります。

精度と再現率の簡単な復習

あなたは町で犯罪者を捕まえるという任務を帯びた刑事だと想像してみてください。実際には、町には10人の犯罪者が徘徊しています。

最初の月に、あなたは8人の容疑者を逮捕しましたが、そのうち4人だけが有罪で、他の4人は無実でした。

もしもあなたが機械学習モデルであれば、あなたは精度と再現率で評価されるでしょう。

精度は、「捕まえた人のうち、何人が犯罪者だったか?」と問います。

再現率は、「町のすべての犯罪者のうち、何人を捕まえたか?」と問います。

精度は、あなたの予測の正確さを捉える指標であり、真陽性を逃した数(偽陰性)を数えません。一方、再現率は、偽陽性の数に関係なく、真陽性の数を測定します。

これらの指標に対して、あなたの刑事スキルはどのように評価されるでしょうか?

  • 精度 = 4 / (4 + 4) = 0.5
  • 再現率 = 4 / (4 + 6) = 0.4

精度と再現率のバランス:F1指標

理想的な世界では、分類器は高い精度と高い再現率を持っています。両方に対する分類器の性能を測るための指標として、F1統計量はその2つの調和平均を測定します:

この指標は、時にはDice類似係数(DSC)とも呼ばれます。

他の方法で類似性を測定する…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...

人工知能

キャルレールの最高製品責任者、ライアン・ジョンソンへのインタビューシリーズ

ライアンは、初期のスタートアップからフォーチュン100の組織まで、多様なテクノロジーと製品開発のリーダーシップ経験を15年...

人工知能

エンテラソリューションズの創設者兼CEO、スティーブン・デアンジェリス- インタビューシリーズ

スティーブン・デアンジェリスは、エンタラソリューションズの創設者兼CEOであり、自律的な意思決定科学(ADS®)技術を用いて...

データサイエンス

2023年にAmazonのデータサイエンティストになる方法は?

ほとんどのビジネスは現在、膨大な量のデータを生成し、編集し、管理しています。しかし、ほとんどのビジネスは、収集したデ...

人工知能

ベイリー・カクスマー、ウォータールー大学の博士課程候補 - インタビューシリーズ

カツマー・ベイリーは、ウォータールー大学のコンピュータ科学学部の博士課程の候補者であり、アルバータ大学の新入教員です...

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...