二项分布是 n个独立的成功/失败试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。这种单次成功/失败试验被称为伯努利试验,而当n=1时,二项分布就是伯努利分布。二项分布是显著性差异的二项试验的基础,可以帮助我们了解和监控生产实践过程中由于某些因素而导致的波动。
二项分布的概率质量函数(probability mass function, PMF)为:
\[ P(\xi = k) = C(n, k) \cdot p^k \cdot (1-p)^{n-k} \]
其中:
\( n \) 是试验的次数。
\( k \) 是成功的次数。
\( p \) 是每次试验成功的概率。
\( C(n, k) \) 是组合数,表示从 \( n \) 次试验中选择 \( k \) 次成功的方式数,计算公式为 \( C(n, k) = \frac{n!}{k!(n-k)!} \)。
二项分布的期望(expected value)和方差(variance)分别为:
\[ E(\xi) = n \cdot p \]
\[ D(\xi) = n \cdot p \cdot (1-p) \]
二项分布适用于在n次独立重复的伯努利试验中,事件发生的次数服从离散概率分布的情况。例如,在医学研究中,对病人治疗结果的有效与无效,某种化验结果的阳性与阴性等,都可以用二项分布来描述。