「全体的な実験の影響を推定する」

Estimating the overall impact of experiments.

組織の総合的な影響を測定する際に、偽発見と選択バイアスをコントロールする方法

CHUTTERSNAPによる写真、Unsplash

はじめに

データ駆動型の組織は、常に数百または数千の実験を実施していますが、これらの実験の総合的な影響は何でしょうか?素朴なアプローチは、有意な正の処置効果をもたらし、本番環境に展開されたすべての実験の平均差を合計することです。しかし、この推定値は非常にバイアスがかかる可能性があります。個々の実験間に相関がないと仮定しても、この素朴なアプローチでは実際の影響が45%も過大評価されることを10,000回のシミュレーションを実行して示します!

我々は、LeeとShenによる理論的なバイアス補正式[1]を検討します。しかし、このアプローチには2つの欠点があります。第一に、理論的にはバイアスがないとされていますが、元の問題と同じ理由で対応するプラグイン推定量には相当なバイアスがあることを示します。第二に、個々のレベルの実験に影響を帰属させることはできません。

この記事では、以下の2つのバイアス要因を探求します:

  • 偽発見バイアス — 偽陽性により推定値が過大評価される;
  • 選択バイアス — 決定基準によって導入されるバイアスにより、処置効果の過小評価(偽陰性)が発生し、過大評価が報酬とされる。

偽発見に対処するために、与えられた結果が実際にゼロでない確率を構築します。この確率は、p値の分布を真のヌルからの参照残差密度と比較することで構築されます。

選択バイアスに対処するために、各実験結果に対して事後分布を計算します。経験的な分布を使用し、偽発見が補正された事前分布とします。

このプロセスにより、シミュレートされた一連の実験の平均的な実験的影響の正確な推定値が得られ、経験的な測定値のみを使用して元の45%の誤差が0.4%の誤差に削減されます。

効果の分布

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

『DeepHowのCEO兼共同創業者、サム・ジェン氏によるインタビューシリーズ』

ディープハウのCEO兼共同創設者であるサム・ジェンは、著名な投資家から支持される急速に進化するスタートアップを率いていま...

人工知能

ベイリー・カクスマー、ウォータールー大学の博士課程候補 - インタビューシリーズ

カツマー・ベイリーは、ウォータールー大学のコンピュータ科学学部の博士課程の候補者であり、アルバータ大学の新入教員です...

人工知能

「クリス・サレンス氏、CentralReachのCEO - インタビューシリーズ」

クリス・サレンズはCentralReachの最高経営責任者であり、同社を率いて、自閉症や関連する障害を持つ人々のために優れたクラ...

データサイエンス

2023年にAmazonのデータサイエンティストになる方法は?

ほとんどのビジネスは現在、膨大な量のデータを生成し、編集し、管理しています。しかし、ほとんどのビジネスは、収集したデ...

人工知能

「マーシャンの共同創設者であるイータン・ギンスバーグについてのインタビューシリーズ」

エタン・ギンズバーグは、マーシャンの共同創業者であり、すべてのプロンプトを最適なLLMに動的にルーティングするプラットフ...

人工知能

「ナレ・ヴァンダニャン、Ntropyの共同創設者兼CEO- インタビューシリーズ」

Ntropyの共同創設者兼CEOであるナレ・ヴァンダニアンは、開発者が100ミリ秒未満で超人的な精度で金融取引を解析することを可...