小白學統計(13)離散型隨機變數概率分佈——二項分佈
所謂機率分佈,是指隨機變數的取值與該取值發生概率所構成的分佈。概率分佈描述了一個隨機變數的所有取值與其相應概率值之間的關係。它可以分為離散型概率分佈和連續型概率分佈(離散型及連續型隨機變數分類見上一篇)。
離散型概率分佈主要有以下三種:
- 二項分佈
- 泊松分佈
- 超幾何分佈
今天介紹的是離散型隨機變數的二項分佈。
在許多試驗中,結果往往只有兩個。例如:檢查產品的品質,其結果只有兩個:合格與不合格;對某種洗髮液消費者的調查結果是:喜歡和不喜歡;撥打一次電話的結果:接通與沒接通。如果試驗的結果多於兩個,但我們只關心其中一個結果,也可以視為只有兩個結果,例如,調查教育程度時,結果有文盲、小學、初中、高中、大學,但我們只對大學感興趣,則這個試驗的結果也只看作兩個:大學和不是大學。
通常把上述試驗的兩個結果(或可以看作兩個結果的)分別用“成功”和“失敗”來代替。一般用“成功”表示我們感興趣的結果,“失敗”表示我們不感興趣的結果。成功的概率用p表示,失敗的概率用q=1-p表示。這一類的試驗我們稱為伯努利試驗。
如果進行n次伯努利試驗,則“成功”的次數是一個隨機變數,其概率分佈被稱為二項分佈。二項分佈的函數運算式為:
其中n為試驗次數;k為n次試驗中“成功”的次數;P為每次試驗中“成功”的概率;q=1-p為每次試驗中“失敗”概率。如果隨機變數X服從二項分佈,記為k~B(n,p)。稱為n和p是二項分佈的參數,即通過n和p可以確定一個二項分佈。
例子:已知某設備廠生產的產品中約有10%的次品,且次品的出現是隨機的。求:
(1)隨機抽取5件產品,其中有2件是次品的概率;
(2)隨機抽取5件產品,最多有1件次品的概率;
解:按照前面的解釋,我們可以將次品定義為“成功”且p=0.1。設X表示實驗中出現次品的數量,則X~B(5, 0.1)。

為了方便二項分佈的計算,統計學家編制了二項分佈表,表中將不同的n和p值列出。當給定X值時,可以直接從表中查出概率值。部分二項分佈表如下:

本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有。
請先 登入 以發表留言。