「条件付き確率とベイズの定理をシンプルに説明する」

「シンプルに説明する条件付き確率とベイズの定理」

条件付き確率とベイズの定理は、統計学の基本的な考え方であり、一般の人々も耳にしたことがあるでしょう。ベイズの定理はまた、統計学の独立した分野であるベイズ推論を生み出します。

データサイエンスでは、主に頻度主義の世界で取り組んでおり、私たちはベイズ原則について完全に把握していないと思います。

次の一連の記事では、ベイズ統計学のいくつかのトピックを扱い、理解を深め、わかりやすい形式でも伝えることを目指します。

この記事では、ベイズ統計学の2つの核心的なアイデアである条件付き確率とベイズの定理について説明します。

周辺確率

最初のステップは、周辺確率を定義することです。これは非常にシンプルなコンセプトですが、実際には過剰に複雑にされることがあります。

周辺確率とは、多くの人が言う/参照する確率のことを指します。特定のイベントが発生する確率だけです。たとえば、コインを投げて表が出る確率であるP(H)は単純に0.5です：

作者によるLaTeXで生成された式。

トランプのカードからダイヤを引く確率、P(D)は0.25です：

作者によるLaTeXで生成された式。

本当にそれほど簡単です！

共同確率

さらに一歩進んで、2回コインを投げた場合の確率は何でしょうか？これは共同確率と呼ばれ、2つのイベントが結合されることを意味します。

この問題を解決するために、2枚のコインを投げた場合の可能な結果をリストアップするだけです：{H,H},{H,T},{T,H},{T,T}。したがって、2回表が出る確率は0.25です：

作者によるLaTeXで生成された式。

ここで∩は、基本的には「かつ」を意味する交差シンボルです。したがって、上記の式は、表が2回とも出る確率を尋ねています。

この場合、共同確率は2つの周辺確率の積として等しくなります。2つのイベント（コイントス）は独立しています（1回のコイントスの結果はもう1回のコイントスの結果に影響を与えない）。

もう1つの重要な性質は、共同確率が可換であることです。つまり：

作者によるLaTeXで生成された式。

これは、ベイズの定理を導出する際に役立ちます！

条件付き確率

条件付き確率とは、ある条件/イベントが発生した場合の確率を決定することです。例で説明しましょう：

赤色のカードを選んだ場合、デッキから3ダイヤモンドを選ぶ確率はどれくらいですか？

さて、3ダイヤモンドを選ぶ確率、P(3D)は次のようになります：

式は著者によってLaTeXで作成されました。

また、赤色のカードを選ぶ確率、P(R)は次のようになります：

式は著者によってLaTeXで作成されました。

<pしたがって、赤色のカードを選んだ場合に3ダイヤモンドを選ぶ確率P(3D | R)は次のようになります：

式は著者によってLaTeXで作成されました。

もうひとつの考え方として、全ての赤いカードが与えられた場合、3ダイヤモンドを選ぶ確率はどれくらいですか？私たちは基本的に、3ダイヤモンドを選ぶデータの部分集合を選んでいます。

AとBの公式数学的な定義は次のとおりです：

式は著者によってLaTeXで作成されました。

したがって、私たちの場合、P(A) = P(3D)およびP(B) = P(R)となります。これらの確率を上記の式に代入することで、確率1/26を導くことができます。

ベイズの定理

条件付き確率の式を再配置すると：

式は著者によってLaTeXで作成されました。

そして、条件付きの式を再度代入すると（共有分布は可換性を持つことを忘れないでください）：

式は著者によってLaTeXで作成されました。

そして、再度配置すると：

式は著者によってLaTeXで作成されました。

それはベイズの定理です！

定理は次のように分解できます：

P(A)は先行確率として知られており、データを観察する前の確率です。これはこのイベントの周辺確率です。

P(B)はデータ/イベントを単体で観察する確率です。これはこのイベントの周辺確率です。これは規範化定数とも呼ばれることがあります。

P(B| A)は私たちが「信じる」とした確率で、尤度として知られています。

P(A | B)は私たちがデータを観察した後の「信念」の確率です。

今のところ、これは少し任意に思えるかもしれませんが、この理論をより具体的にするために例を挙げていきます。

全確率の法則

我々が取り上げる最終的な式は総合確率の法則(Law of total probability)です：

LaTeXで作成された方程式

この式については、2つの異なる方法で考えることができます：

全ての重なり合う領域AがBをカバーする領域の合計

AのB上の加重平均

この式の直感を説明している素晴らしいStat Exchangeスレッドがここにリンクされています！

例

これからBayesの定理を実際に使用した例題を進めていきます！

デッキを2つ持っているとします：一つは普通のデッキD_1、もう一つは赤いカードだけ（ダイヤとハート）のデッキD_2です。

デッキからランダムに選び、ダイヤの33Dを引き出しました。この3Dが普通のデッキD_1から出た確率は何でしょうか？

まず、どちらのデッキをランダムに選ぶ事前確率P(D_1)とP(D_2)を述べましょう。これは単純に50-50です：

次に、尤度を計算しましょう：

2つ目のデッキには赤いカードしかないため、総合確率の法則を使用してダイヤの3を観測する確率を計算します：

これらを合わせてBayesの定理を使いましょう：

これはデッキ1から3Dを引く確率です！

直感的に、2つ目のデッキから3Dを引く可能性が高いため、この確率は意味をなしています。

結論

この記事では、条件付き確率とBayesの定理の概念を理解するための手順を説明しました：

周辺確率は、そのイベントが起こる確率です

結合確率は、2つのイベントが同時に起こる確率です

条件付き確率は、別のイベントが発生した場合にイベントが発生する確率です

Bayesの定理は、条件付き確率を計算するための事前情報を持っている場合の条件付き確率の代替バージョンです

ここでオリジナル記事をご覧いただけます。掲載許可済み。

</pしたがって、赤色のカードを選んだ場合に3ダイヤモンドを選ぶ確率

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Related articles

「伝統的な機械学習はまだ重要ですか？」
「365データサイエンスは、11月20日まで無料のコースアクセスを提供しています」
「Cheat Sheetつきで始めるグラフデータベースクエリ」
基礎に戻る週1：Pythonプログラミング＆データサイエンスの基礎
テキスト生成の新時代：RAG、LangChain、およびベクトルデータベース
DB-GPT プロプライエタリLLMテクノロジーを使用して、データベースとのインターフェースを変革する
「パンドラの箱をのぞいてみよう：『ホワッツインマイビッグデータ（WIMBD）』で言語モデルのデータセットの隠された複雑さを明らかにする」

このAIニュースレターはあなたが必要なすべてです #72

「自動通話要約を通じて、エージェントの生産性を向上させるために生成的AIを使用する」