分類の評価指標:正確度を超えて

美容とファッションの専門家が語る:評価基準の探求-正確性を超えて

混同行列、精度、再現率、F1スコア、およびROC曲線の解説

Kolleen Gladden撮影、Unsplashより

この記事では、モデルの性能を評価するための最適な指標が正確さだけではないことを、特に分類タスクの場合について説明し、モデルの性能をよりよく把握するための代替指標を紹介します。また、これらの指標の考え方の背景や使用するタイミングについても、具体例を挙げながら説明します。ただし、この議論に入る前に、必要な基本事項を確認しましょう。

回帰 vs 分類

教師あり機械学習は大まかに回帰と分類の2つに分類できます。

回帰: 回帰では、モデルの目標は連続した値を予測することです。たとえば、サイズ、ベッドルームの数、地域などの入力特徴から家の価格を予測する場合などです。

分類: 入力特徴に基づいて離散的なクラスラベルを予測することに関わります。分類の例としては、メールのスパム検出、疾患検出、画像分類などがあります。

回帰問題では、ターゲット値(予測したい値のこと)は連続値であるため、MAE(平均絶対誤差)、MSE(平均二乗誤差)、R二乗などの指標を使用することは理にかなっています。これらの指標は、各インスタンスの実際の値と予測値の差(誤差または残差とも呼ばれる)の計算を必要とします。

一方、分類のターゲット値はしばしばカテゴリカルであり、このような数学的な指標の計算は適切ではありません。したがって、クラス分類モデルの性能を定量化するためには他の手段が必要であり、正解率はその一つのオプションです。

正解率とは何ですか?

私たちの分類器を評価する最も簡単かつ明快な方法の一つは、分類器が正しく分類されたインスタンスの割合を見ることです。これは、単純に正しい予測数をデータセットの総インスタンス数で割ることで行います。これが正解率です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more