ポアソン二項分布

ポアソン二項分布
	確率質量関数;
	累積分布関数;
母数	− n 回試行のそれぞれに対する成功確率
台
確率質量関数
累積分布関数
期待値
分散
歪度
尖度
モーメント母関数
特性関数
	テンプレートを表示

ポアソン二項分布（ポアソンにこうぶんぷ、英: Poisson binomial distribution）とは、統計学および確率論における独立なベルヌーイ試行の和として定義される離散確率分布である。

別の言い方をすれば、これは成功確率がそれぞれ $p 1, p 2, \dots, p n$ でありそれぞれ独立な $n$ 回の試行を行ったときの成功回数の離散確率分布である。

特に、成功確率が全て等しい ( $p 1 = p 2 = \dots = p n$ ) ときは、ポアソン二項分布は普通の二項分布になる。すなわち二項分布はポアソン二項分布の特別な場合である。

確率質量関数

$n$ 個の確率変数 $X i$ ( $i \in {1, 2, \dots, n}$ ) は、それぞれ独立で成功確率がそれぞれ $p 1, p 2, \dots, p n$ であるベルヌーイ試行とする。すなわち、

X_{i}\in \{1,0\},\qquad P(X_{i}=1)=p_{i},\qquad \Pr(X_{i}=0)=1-p_{i}

とする。確率変数 $X=\sum _{i=1}^{n}X_{i}$ は、このような $n$ 回の試行のうちで成功した回数を表す確率変数である。 $k$ 回成功する確率は次のような和で表現される^[1]。

\Pr(X=k)=\sum _{A\in F_{k}}\prod _{i\in A}p_{i}\prod _{j\in A^{c}}(1-p_{j})

ただし、 $F k$ は ${1, 2, \dots, n}$ から選べる全ての $k$ 要素部分集合の族である。例えば $n = 3$ なら、 $F 2 = {{1, 2}, {1, 3}, {2, 3}}$ である。また $A c$ は $A$ の補集合。すなわち $A^{c}=\{1,2,3,\dots ,n\}\backslash A$ である。

これが、定義から直接導かれるポアソン二項分布の確率質量関数である。 $F k$ は ${\frac {n!}{(n-k)!k!}}$ 要素を含み、この数は $n$ とともに急速に増大するため、試行回数 $n$ が小さい場合以外は実際にこの和を計算することは困難である。（例えば $n = 30$ のとき $F 15$ は $1020$ もの要素を含む）。幸いにも、 $\Pr(X=k)$ を計算する非常に効果的な方法がある。1回も成功しない確率が分かれば、 $n$ 回成功の確率は次のようにして再帰的に計算できる^[2]。

\Pr(X=k)=\left\{{\begin{aligned}&\prod _{i=1}^{n}(1-p_{i}),\qquad k=0\\&{\frac {1}{k}}\sum _{i=1}^{k}(-1)^{i-1}\Pr(X=k-i)T(i),\qquad k>0\\\end{aligned}}\right.

ただし、 $T(i)=\sum _{j=1}^{n}\left({\frac {p_{j}}{1-p_{j}}}\right)^{i}$ 。

他にも離散フーリエ変換を使う次のような計算も可能である^[3]。

\Pr(X=k)={\frac {1}{n+1}}\sum _{l=0}^{n}C^{lk}\prod _{m=1}^{n}\left(1+(C^{l}-1){p_{m}}\right)

ただし、 $C=\exp \left(-{\frac {2i\pi }{n+1}}\right)$ である。

さらに他の方法も提案されている^[4]。

平均と分散

ポアソン二項分布は独立なベルヌーイ分布に従う $n$ 個の確率変数の和だから、その平均と分散は各ベルヌーイ分布における平均および分散の和となる。

\mu =\sum _{i=1}^{n}p_{i}

\sigma ^{2}=\sum _{i=1}^{n}(1-p_{i})p_{i}

レ・カムの定理

次の定理がルーシェン・レ・カム (Lucien le Cam) によって示された^[5]^[6]。

次のように仮定する。

$X 1, \dots, X n$ はそれぞれベルヌーイ分布に従う独立な確率変数とする。（すなわち $0$ か $1$ の値をとる）ただしそれぞれが同一の分布である必要はない。（発生確率がそれぞれ異なっていてもよい）各 $i = 1, 2, 3, \dots$ に対して、 $\Pr(X_{i}=1)=p_{i}$ とする。
$\lambda _{n}=p_{1}+\cdots +p_{n}.$
$S_{n}=X_{1}+\cdots +X_{n}.$ （すなわち $S n$ はポアソン二項分布に従う。）

このとき、

\sum _{k=0}^{\infty }\left|\Pr(S_{n}=k)-{\lambda _{n}^{k}e^{-\lambda _{n}} \over k!}\right|<2\sum _{i=1}^{n}{p_{i}}^{2}.

換言すれば、この和はポアソン分布で近似できる。

各分布がすべて同じ値 $p_{i}={\frac {\lambda _{n}}{n}}$ とすれば、右辺は $2{\frac {{\lambda _{n}}^{2}}{n}}$ となる。すなわち、この定理は、二項分布の極限がポアソン分布になるというポアソンの極限定理の一般化である。

出典

参考文献

Steele, J. Michael (1994), “Le Cam's Inequality and Poisson Approximations” (PDF), The American Mathematical Monthly 101 (1): 48-54, doi:10.2307/2325124 2010年2月20日閲覧。

[1]

[2]

[3]

[4]

[5]

[6]

表話編歴確率分布
離散単変量で有限台	ベンフォードベルヌーイベータ二項（英語版）二項 categorical（英語版）超幾何ポワソン二項ラーデマッハ（英語版）離散一様ジップジップ–マンデルブロー（英語版）
離散単変量で無限台	ベータ負二項（英語版）ボレル（英語版）コンウェイ–マクスウェル–ポワソン（英語版）離散位相型（英語版）ドラポルト（英語版）拡張負二項（英語版）ガウス–クズミン幾何対数（英語版）負の二項放物フラクタル（英語版）ポワソンスケラム（英語版）ユール–サイモン（英語版）ゼータ（英語版）
連続単変量で有界区間に台を持つ	逆正弦（英語版） ARGUS（英語版）バルディング–ニコルス（英語版）ベイツ（英語版）ベータ beta rectangular（英語版）アーウィン–ホール（英語版）クマラスワミー（英語版）ロジット-正規（英語版）非中心ベータ（英語版） raised cosine（英語版） reciprocal（英語版）三角 U-quadratic（英語版）一様ウィグナー半円
連続単変量で半無限区間に台を持つ	ベニーニ（英語版）ベンクタンダー第一種（英語版）ベンクタンダー第二種（英語版）第2種ベータ Burr（英語版）カイ二乗カイ（英語版） Dagum（英語版）デービス（英語版）指数-対数（英語版）アーラン指数 F folded normal（英語版） Flory–Schulz（英語版）フレシェガンマ gamma/Gompertz（英語版）一般逆ガウス（英語版） Gompertz（英語版） half-logistic（英語版） half-normal（英語版） Hotelling's T-squared（英語版）超アーラン（英語版）超指数（英語版） hypoexponential（英語版）逆カイ二乗（英語版） scaled inverse chi-squared（英語版）逆ガウス逆ガンマコルモゴロフレヴィ対数コーシー対数ラプラス（英語版）対数ロジスティック（英語版）対数正規ロマックス（英語版）行列指数（英語版）マクスウェル–ボルツマンマクスウェル–ユットナー（英語版）ミッタク-レフラー（英語版）仲上（英語版）非心カイ二乗パレート位相型（英語版） poly-Weibull（英語版）レイリー relativistic Breit–Wigner（英語版）ライス（英語版） shifted Gompertz（英語版）切断正規タイプ2ガンベル（英語版）ワイブル離散ワイブル（英語版）ウィルクスのラムダ（英語版）
連続単変量で実数直線全体に台を持つ	コーシー（ローレンツ、ブライト・ウィグナー）指数冪（英語版）フィッシャーの z（英語版）ガウスの q（英語版）一般正規（英語版）一般化双曲型幾何安定（英語版）ガンベルホルツマルク（英語版）双曲線正割ジョンソンの S_U（英語版）ランダウラプラス非対称ラプラス（英語版）ロジスティック非心 t 正規 (ガウス) 正規逆ガウス（英語版）歪正規（英語版）スラッシュ安定スチューデントの t タイプ1ガンベル（英語版）トレイシー–ウィダム（英語版）分散ガンマ（英語版）フォークト
連続単変量でタイプの変わる台を持つ	一般極値一般パレート（英語版）マルチェンコ–パストゥール（英語版） q-指数（英語版） q-ガウス q-ワイブル（英語版） shifted log-logistic（英語版）トゥーキーのラムダ（英語版）
混連続-離散単変量	rectified Gaussian（英語版）
多変量 (結合)	【離散】エウェンズ（英語版）多項ディリクレ多項（英語版）負多項（英語版）【連続】ディリクレ一般ディリクレ（英語版）多変量正規多変量安定（英語版）多変量 t（英語版）正規逆ガンマ（英語版）正規ガンマ（英語版）【行列値】逆行列ガンマ（英語版）逆ウィッシャート（英語版）行列正規（英語版）行列 t（英語版）行列ガンマ（英語版）正規逆ウィッシャート（英語版）正規ウィッシャート（英語版）ウィッシャート
方向	【単変量 (円周) 方向】円周一様（英語版）単変数フォン・ミーゼス wrapped 正規（英語版） wrapped コーシー（英語版） wrapped 指数（英語版） wrapped 非対称ラプラス（英語版） wrapped レヴィ（英語版）【二変量 (球面)】ケント（英語版）【二変量 (トロイダル)】二変数フォン・ミーゼス（英語版）【多変量】フォン・ミーゼス–フィッシャー（英語版）ビンガム（英語版）
退化と特異	【退化】ディラックのデルタ関数【特異】カントール
族	円周（英語版）混合ポワソン（英語版）楕円（英語版）指数自然指数（英語版）位置尺度（英語版）最大エントロピー（英語版）混合（英語版）ピアソン（英語版）トウィーディ（英語版） wrapped（英語版）
サンプリング法（英語版）	逆関数サンプリング法マルコフ連鎖モンテカルロ法（メトロポリス・ヘイスティングス法・ギブスサンプリング・スライスサンプリング）粒子フィルタボックス＝ミュラー法棄却サンプリング（英語版）ジッグラト法（英語版）マルサグリア法（英語版）
一覧（英語版）カテゴリ

確率質量関数

平均と分散

レ・カムの定理

関連項目

出典

参考文献