「ML（Machine Learning）製品に自信を持つことを忘れないでください」

「ML（Machine Learning）製品を自信を持って利用しましょう！」

マシンラーニングは絶対に100％正確ではありません。したがって、ユーザーが予測の不確実性を理解している場合にのみ、MLモデルが役立ちます。

ほぼ毎日、新しいマシンラーニング製品、サービス、またはデータセットの発売が発見されます。これはAIの時代ですが、これらの製品のほとんどは、ユーザーが結果にどれだけの信頼を持つべきかを通知しません。しかし、研究によると、良い意思決定にはAIを信頼するタイミングと信頼しないタイミングを知る知識が必要です。そうでない場合、ユーザーはモデルを頻繁に試して、そのモデルを信頼するタイミングと信頼しないタイミングを理解し、提供される製品が役立つかどうかを見つける必要があります。

ユーザーによるこの試行錯誤の原因は、すべてのモデル（MLや統計に基づくかどうかに関係なく）がデータとその不確実性に基づいて構築されていることです。モデルの基になるデータは、モデルが予測するべき実際の真実を表していません。そうでなければ、最初からモデルが必要ありません。したがって、結果として得られるモデルは推定値を提供するだけであり、真の価値ではありません。

要するに、マシンラーニングや統計モデルの正しさは不確定であり、常に信頼することはできません。

例：クロスカウンティの移動を予測する

例を挙げてみましょう（図1）。ある国から別の国への人々の移動量を提供する製品を想像してください。もちろん、税務報告書などのデータがその情報を提供してくれるかもしれませんが、そのデータは本当に移動全体のポピュレーションを代表しているでしょうか？すべての学生、移民、または海外駐在員が税務報告書を変えているのでしょうか？おそらくそうではないでしょう。したがって、移動を提供するという簡単な製品でさえ、その基になるデータサンプル（たとえば公開されている税務報告書）に偏りがあります。より洗練された製品が偏っていることは容易に想像できます。

マシンラーニングでは、この制約はさらに悪化します。確率的な性質、多様な入力、および各入力が人口のごく一部を表しているためです。したがって、基になるモデルは、トレーニングデータで記述されたケースの大部分に偏り、現実から乖離することになります。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

「ML（Machine Learning）製品に自信を持つことを忘れないでください」

マシンラーニングは絶対に100％正確ではありません。したがって、ユーザーが予測の不確実性を理解している場合にのみ、MLモデルが役立ちます。

例：クロスカウンティの移動を予測する

Was this article helpful?

ドメインを橋渡しする：MLリスク管理における金融、プライバシー、ソフトウェアのベストプラクティスの注入

「初心者のためのバイトペアエンコーディング」

データサイエンス