「精度と再現率を超えて:Tversky指数に深く潜る」

Beyond Accuracy and Recall Delving Deep into the Tversky Index

代替の分類指標の探索

写真:Ricardo Arceさん撮影、Unsplashより

データサイエンスの世界では、指標はモデルを成功に導くコンパスです。多くの人は精度と再現率という古典的な指標について知っていますが、実は他にも試す価値のあるさまざまなオプションがあります。

この記事では、Tversky指数について掘り下げていきます。この指標は、Dice係数とJaccard係数の一般化であり、精度と再現率をバランスさせる際に非常に役立ちます。ニューラルネットワークの損失関数として実装すると、クラスの不均衡に対処するための強力な手段となります。

精度と再現率の簡単な復習

あなたは町で犯罪者を捕まえるという任務を帯びた刑事だと想像してみてください。実際には、町には10人の犯罪者が徘徊しています。

最初の月に、あなたは8人の容疑者を逮捕しましたが、そのうち4人だけが有罪で、他の4人は無実でした。

もしもあなたが機械学習モデルであれば、あなたは精度と再現率で評価されるでしょう。

精度は、「捕まえた人のうち、何人が犯罪者だったか?」と問います。

再現率は、「町のすべての犯罪者のうち、何人を捕まえたか?」と問います。

精度は、あなたの予測の正確さを捉える指標であり、真陽性を逃した数(偽陰性)を数えません。一方、再現率は、偽陽性の数に関係なく、真陽性の数を測定します。

これらの指標に対して、あなたの刑事スキルはどのように評価されるでしょうか?

  • 精度 = 4 / (4 + 4) = 0.5
  • 再現率 = 4 / (4 + 6) = 0.4

精度と再現率のバランス:F1指標

理想的な世界では、分類器は高い精度と高い再現率を持っています。両方に対する分類器の性能を測るための指標として、F1統計量はその2つの調和平均を測定します:

この指標は、時にはDice類似係数(DSC)とも呼ばれます。

他の方法で類似性を測定する…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

3つの質問:大規模言語モデルについて、Jacob Andreasに聞く

CSAILの科学者は、最新の機械学習モデルを通じた自然言語処理の研究と、言語が他の種類の人工知能をどのように高めるかの調査...

データサイエンス

「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」

セラフィム・バツォグルはSeerのチーフデータオフィサーですSeerに加わる前は、セラフィムはInsitroのチーフデータオフィサー...

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...

人工知能

「パクストンAIの共同創業者兼CEO、タングイ・シャウ - インタビューシリーズ」

タングイ・ショウは、Paxton AIの共同創設者兼CEOであり、法的研究と起草の負担を軽減するためにGenerative AIを使用するプラ...

人工知能

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ジョナサン・ダムブロットは、Cranium AIのCEO兼共同創業者ですCranium AIは、サイバーセキュリティおよびデータサイエンスチ...

データサイエンス

「David Smith、TheVentureCityの最高データオフィサー- インタビューシリーズ」

デビッド・スミス(別名「デビッド・データ」)は、TheVentureCityのチーフデータオフィサーであり、ソフトウェア駆動型のス...