確率的なML(機械学習)とは、Pythonを使ったクォンタイルマッチングの例
確率的なML(機械学習)とは、Pythonを使ったクォンタイルマッチングの例
分位点回帰予測を確率分布に変換するためのあまり知られていない技術。
- 分位点回帰
- 分位点マッチング
- Pythonの例:糖尿病の進行を予測する
- 結論
回帰モデルを訓練すると、点予測が得られます。しかし、実際のところ、私たちはしばしば各予測に関連する不確実性を推定することに興味があります。そのためには、予測しようとしている値が確率変数であると仮定し、その分布を推定することが目標です。
予測から不確実性を推定するための多くの方法があります。例えば、分散推定、ベイジアン法、一致性予測などがあります。分位点回帰は、これらのよく知られた方法の一つです。
分位点回帰
分位点回帰は、興味のある各分位点ごとに1つのモデルを推定することです。これは、ピンボール損失として知られる非対称損失関数の使用によって達成できます。分位点回帰は簡単で理解しやすく、LightGBMのような高性能なライブラリで簡単に利用できます。しかし、分位点回帰にはいくつかの問題があります:
- 分位点の順序が正しいことを保証するものではありません。たとえば、50%の分位点の予測が60%の分位点の予測よりも大きい場合、これは不合理です。
- 全体の分布の推定を得るためには、多くのモデルを訓練する必要があります。たとえば、各パーセント分位点ごとの推定が必要な場合、99個のモデルを訓練する必要があります。
ここで、分位点マッチングがどのように役立つかを見てみましょう。
分位点マッチング
分位点マッチングの目標は、分位点の推定サンプルを与えられた場合に分布関数を適合させることです。これを回帰問題としてフレーム化することができるため、曲線は分位点に完全にフィットする必要はありません。代わりに、「できるだけ近く」であるべきであり、それでいて分布関数の特性を保持する必要があります。
具体的には、逆累積分布関数の推定に興味があります:与えられた…
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles