「全体的な実験の影響を推定する」

Estimating the overall impact of experiments.

組織の総合的な影響を測定する際に、偽発見と選択バイアスをコントロールする方法

CHUTTERSNAPによる写真、Unsplash

はじめに

データ駆動型の組織は、常に数百または数千の実験を実施していますが、これらの実験の総合的な影響は何でしょうか?素朴なアプローチは、有意な正の処置効果をもたらし、本番環境に展開されたすべての実験の平均差を合計することです。しかし、この推定値は非常にバイアスがかかる可能性があります。個々の実験間に相関がないと仮定しても、この素朴なアプローチでは実際の影響が45%も過大評価されることを10,000回のシミュレーションを実行して示します!

我々は、LeeとShenによる理論的なバイアス補正式[1]を検討します。しかし、このアプローチには2つの欠点があります。第一に、理論的にはバイアスがないとされていますが、元の問題と同じ理由で対応するプラグイン推定量には相当なバイアスがあることを示します。第二に、個々のレベルの実験に影響を帰属させることはできません。

この記事では、以下の2つのバイアス要因を探求します:

  • 偽発見バイアス — 偽陽性により推定値が過大評価される;
  • 選択バイアス — 決定基準によって導入されるバイアスにより、処置効果の過小評価(偽陰性)が発生し、過大評価が報酬とされる。

偽発見に対処するために、与えられた結果が実際にゼロでない確率を構築します。この確率は、p値の分布を真のヌルからの参照残差密度と比較することで構築されます。

選択バイアスに対処するために、各実験結果に対して事後分布を計算します。経験的な分布を使用し、偽発見が補正された事前分布とします。

このプロセスにより、シミュレートされた一連の実験の平均的な実験的影響の正確な推定値が得られ、経験的な測定値のみを使用して元の45%の誤差が0.4%の誤差に削減されます。

効果の分布

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...

人工知能

エンテラソリューションズの創設者兼CEO、スティーブン・デアンジェリス- インタビューシリーズ

スティーブン・デアンジェリスは、エンタラソリューションズの創設者兼CEOであり、自律的な意思決定科学(ADS®)技術を用いて...

人工知能

Diginiのスマートセンスの社長、ガイ・イエヒアブによるインタビューシリーズ

ガイ・イハイアヴ氏は、ビジネスの成功に最も重要な資産を保護するためにインターネット・オブ・シングス(IoT)の力を活用す...

人工知能

ピーター・マッキー、Sonarの開発者担当責任者-インタビューシリーズ

ピーター・マッキーはSonarのDeveloper Relationsの責任者です Sonarは、悪いコードの1兆ドルの課題を解決するプラットフォー...

機械学習

3つの質問:大規模言語モデルについて、Jacob Andreasに聞く

CSAILの科学者は、最新の機械学習モデルを通じた自然言語処理の研究と、言語が他の種類の人工知能をどのように高めるかの調査...

人工知能

『DeepHowのCEO兼共同創業者、サム・ジェン氏によるインタビューシリーズ』

ディープハウのCEO兼共同創設者であるサム・ジェンは、著名な投資家から支持される急速に進化するスタートアップを率いていま...