これがP-Hackingの解決策ですか?

(P-Hacking no kaiketsu sa wa kore desu ka?)

Eに変換されたP。Dall·E 3によって作成された画像(著者による)

E-値、p-値の改良された代替方法

科学的研究において、データの操作や結果ののぞき見はこの分野が存在して以来の問題となっています。研究者はしばしば掲載されるために有意なp-値を目指し、そのためにデータ収集を早めに終了したりデータを操作する誘惑に駆られます。これが「p-ハッキング」として知られる実践の中心となっています。前回の記事ではこの問題を取り上げました(私の前の記事)。研究者がデータ値を意図的に変更したり完全なデータセットを偽造することを決めた場合、私たちにできることはあまりありません。ただし、p-ハッキングの一部のインスタンスには解決策が用意されているかもしれません!

この記事では、安全なテストのテーマについて掘り下げていきます。安全なテストは、従来の仮説検定方法に比べていくつかの強力な利点があります。たとえば、このテスト方法では複数の研究の結果を組み合わせることができます。また、実験を任意の時点で停止することができるという利点もあります。この安全なテストを示すために、研究者たちが提案した理論に基づくRパッケージsafestatsを使用します。E-値について紹介し、解決できる問題を説明します。E-値はNetflixやAmazonなどの企業でもすでに利用されており、その利点から選ばれています。

この理論の証明には踏み込まず、この記事ではより実践的なアプローチを採用し、自分自身のテストでE-値を使用する方法を示します。証明や安全なテストの詳しい説明については、元の論文が良いリソースとなります。

E-値の紹介

仮説検定では、こちらで復習可能ですが、帰無仮説を保持するか選択的な代替仮説を受け入れるかを評価します。通常、このためにp-値が使用されます。p-値が事前に設定された有意水準のアルファよりも小さい場合、代替仮説を受け入れます。

E-値はp-値とは異なる方法で機能しますが、関連があります。E-値の最も簡単な解釈は次のようなものです:帰無仮説に対してギャンブルをしていると想像してください。1ドルを投資し、リターン値がEドルと等しい場合、e-値Eが0〜1の間にあると負け、帰無仮説が真実であることがわかります。一方、e-値が1よりも大きい場合、勝ちます!帰無仮説はゲームに負けます。控えめなE値1.1は、…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more