ポアソン二項分布(ポアソンにこうぶんぷ、英: Poisson binomial distribution)とは、統計学および確率論における独立なベルヌーイ試行の和として定義される離散確率分布である。
別の言い方をすれば、これは成功確率がそれぞれ p1, p2, …, pn でありそれぞれ独立な n 回の試行を行ったときの成功回数の離散確率分布である。
特に、成功確率が全て等しい (p1 = p2 = … = pn) ときは、ポアソン二項分布は普通の二項分布になる。すなわち二項分布はポアソン二項分布の特別な場合である。
確率質量関数
n 個の確率変数 Xi (i ∈ {1, 2, …, n}) は、それぞれ独立で成功確率がそれぞれ p1, p2, …, pn であるベルヌーイ試行とする。すなわち、
![{\displaystyle X_{i}\in \{1,0\},\qquad P(X_{i}=1)=p_{i},\qquad \Pr(X_{i}=0)=1-p_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/344ae8ff6e64292216b0d8bd18d222cc162228d2)
とする。確率変数
は、このような n 回の試行のうちで成功した回数を表す確率変数である。k 回成功する確率は次のような和で表現される[1]。
![{\displaystyle \Pr(X=k)=\sum _{A\in F_{k}}\prod _{i\in A}p_{i}\prod _{j\in A^{c}}(1-p_{j})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/97932c89ed1a2a38dd9697efa95fe2938ec8d596)
ただし、Fk は {1, 2, …, n} から選べる全ての k要素部分集合の族である。例えば n = 3 なら、F2 = {{1, 2}, {1, 3}, {2, 3}} である。また Ac は A の補集合。すなわち
である。
これが、定義から直接導かれるポアソン二項分布の確率質量関数である。Fk は
要素を含み、この数は n とともに急速に増大するため、試行回数 n が小さい場合以外は実際にこの和を計算することは困難である。(例えば n = 30 のとき F15 は 1020 もの要素を含む)。幸いにも、
を計算する非常に効果的な方法がある。1回も成功しない確率が分かれば、n 回成功の確率は次のようにして再帰的に計算できる[2]。
![{\displaystyle \Pr(X=k)=\left\{{\begin{aligned}&\prod _{i=1}^{n}(1-p_{i}),\qquad k=0\\&{\frac {1}{k}}\sum _{i=1}^{k}(-1)^{i-1}\Pr(X=k-i)T(i),\qquad k>0\\\end{aligned}}\right.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7398092c22cb53fb44cc18925eedee96c3c0262d)
ただし、
。
他にも離散フーリエ変換を使う次のような計算も可能である[3]。
![{\displaystyle \Pr(X=k)={\frac {1}{n+1}}\sum _{l=0}^{n}C^{lk}\prod _{m=1}^{n}\left(1+(C^{l}-1){p_{m}}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7a70df0fc38effa2ed01a082d72672ddedf1ef0d)
ただし、
である。
さらに他の方法も提案されている[4]。
平均と分散
ポアソン二項分布は独立なベルヌーイ分布に従う n個の確率変数の和だから、その平均と分散は各ベルヌーイ分布における平均および分散の和となる。
![{\displaystyle \mu =\sum _{i=1}^{n}p_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6b9132df574b4ef3bf96091dc3ded0bed8d81cbf)
![{\displaystyle \sigma ^{2}=\sum _{i=1}^{n}(1-p_{i})p_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ff63106da454d0dffb5f67dd8a9df6aba637aaf7)
レ・カムの定理
次の定理がルーシェン・レ・カム (Lucien le Cam) によって示された[5][6]。
次のように仮定する。
- X1, …, Xn はそれぞれベルヌーイ分布に従う独立な確率変数とする。(すなわち 0 か 1 の値をとる)ただしそれぞれが同一の分布である必要はない。(発生確率がそれぞれ異なっていてもよい) 各 i = 1, 2, 3, … に対して、
とする。 ![{\displaystyle \lambda _{n}=p_{1}+\cdots +p_{n}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1c6c58b8fe83966bbe11527f28d41f229101f04b)
(すなわち Sn はポアソン二項分布に従う。)
このとき、
![{\displaystyle \sum _{k=0}^{\infty }\left|\Pr(S_{n}=k)-{\lambda _{n}^{k}e^{-\lambda _{n}} \over k!}\right|<2\sum _{i=1}^{n}{p_{i}}^{2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a0d073da79392e24fde6ed8763654f4bbed71d7d)
換言すれば、この和はポアソン分布で近似できる。
各分布がすべて同じ値
とすれば、右辺は
となる。すなわち、この定理は、二項分布の極限がポアソン分布になるというポアソンの極限定理の一般化である。
関連項目
出典
参考文献
|
---|
離散単変量で 有限台 | |
---|
離散単変量で 無限台 | |
---|
連続単変量で 有界区間に台を持つ | |
---|
連続単変量で 半無限区間に台を持つ | |
---|
連続単変量で 実数直線全体に台を持つ | |
---|
連続単変量で タイプの変わる台を持つ | |
---|
混連続-離散単変量 | |
---|
多変量 (結合) | |
---|
方向 | |
---|
退化と特異 | |
---|
族 | |
---|
サンプリング法(英語版) | |
---|
|