《普通高等教育“十二五”規劃教材:概率論與數理統計》是一本供非數學專業學生使用的概率論與數理統 計教材。全書共10章,內容包括隨機事件和概率、離散型隨機變量及其分布、連續型隨機變量及其分布、隨機變量的數字特征、大數定律和中心極限定理、數理統 計的基本概念、參數估計、假設檢驗、方差分析與回歸分析、統計軟件SPSS簡介。每一章后面有相當數量的習題,并在書末配有參考答案。為了使學生對這門課 程在現實生產、生活中的應用有一個感性的認識,在每一章的最后都提供了一篇課外拓展閱讀,以提高學生的學習興趣和應用意識。
《普通高等教育“十二五”規劃教材:概率論與數理統計》是一本供非數學專業學生使用的概率論與數理統計教材。本書融入了編者多年的教學經驗,吸取了國內同類教材的長處,緊扣碩士研究生入學考試大綱,可供高等學校中的工科、農醫、經濟、管理等專業使用。
前言
第1章 隨機事件和概率
1.1 隨機事件
一、隨機試驗
二、樣本空間
三、隨機事件
四、事件間的關系與運算
1.2 概率的定義
一、概率的統計定義
二、概率的公理化定義
三、古典概型
四、幾何概型
1.3 條件概率、全概率公式和貝葉斯公式
一、條件概率
二、乘法公式
三、全概率公式與貝葉斯公式
1.4 事件的獨立性
1.5 伯努利概型
課外拓展閱讀產生十幾位數學家和物理學家的家族
習題1
第2章 離散型隨機變量及其分布
2.1 隨機變量
2.2 離散型隨機變量及其分布律
一、兩點分布
二、二項分布
三、泊松(Poisson)分布
四、幾何分布
五、超幾何分布
2.3 二維隨機變量及其分布
一、聯合分布律
二、邊緣分布律
2.4 隨機變量的獨立性與條件分布
2.5 隨機變量函數的分布
一、一維隨機變量函數的分布
二、二維隨機變量函數的分布
課外拓展閱讀帕斯卡與早期概率論的發展
習題2
第3章 連續型隨機變量及其分布
3.1 分布函數與概率密度函數
3.2 常用的一維連續型隨機變量
一、均勻分布
二、指數分布
三、正態分布
3.3 二維隨機變量及其分布
一、聯合密度函數
二、邊緣密度函數
3.4 隨機變量的獨立性與條件密度函數
一、隨機變量的獨立性
二、條件密度函數
3.5 隨機變量函數的分布
一、一維隨機變量函數的分布
二、兩個隨機變量之和的分布
三、兩個隨機變量之商的分布
四、隨機變量最大值、最小值的分布
課外拓展閱讀統計學家與戰爭
習題3
第4章 隨機變量的數字特征
4.1 數學期望
一、離散型隨機變量的數學期望
二、連續型隨機變量的數學期望
三、隨機變量函數的數學期望
四、數學期望的性質
第5章 大數定律和中心極限定理
第6章 數理統計的基本概念
第7章 參數估計
第8章 假設檢驗
第9章 方差分析與回歸分析
第10章 統計軟件SPSS簡介
習題參考答案
參考文獻
附錄
第1章 隨機事件和概率
在自然界、生產實踐、科學實驗和日常生活中發生的現象,按其結果能否準確預測來劃分,可以分為兩大類:一類是必然現象;另一類是隨機現象. 在一定條件下必然發生的現象稱為必然現象.例如,在標準大氣壓下,純水加熱到100℃必然沸騰;向上拋一石頭必然會落下.所有這些現象的特點就是,在一定條件下必定出現某一結果,并且是可以事先預測的,即在準確地重復某些條件的情況下,它的結果總是可以肯定的. 另一類現象是在一定條件下,可能會出現多種不同的結果,但在觀測之前無法預知其確切結果的現象,這一類現象稱為隨機現象.例如,拋一枚硬幣,最終落在地上是一種必然現象,而落地后正面朝上還是反面朝上卻是一種隨機現象;某種電器使用壽命的長短是一種隨機現象.這類現象的共同特點是:在相同條件下可重復進行試驗,但每次試驗不止出現一個結果,即試驗結果呈現出不確定性. 事實上,在個別試驗中,隨機現象的結果雖然呈現出不確定性,但是經多次重復試驗,卻可發現它仍然呈現出某種規律性,這種規律性稱為隨機事件的統計規律性.
一、隨機試驗
滿足下列三個條件的試驗稱為隨機試驗:
(1)試驗在相同條件下可重復進行;
(2)每次試驗的可能結果不止一個,但能事先明確試驗的所有可能結果;
(3)每次試驗前不能確定哪一個結果發生.隨機試驗是一種含義較廣的術語,它包括對隨機現象進行觀察、測量、記錄或做 科學實驗等,以后簡稱試驗,常用字母E1,E2,.表示.
例1.1.1 下面的四個實驗都是隨機試驗.
E1:拋一枚硬幣,觀察正面H、反面T出現的情況.顯然,結果是集合{H,T}的一 個元素;E2:將一枚硬幣連續拋兩次,觀察試驗的結果.這時,所有可能的結果為{HH,HT,TH,TT};E3:對某目標進行射擊,觀察直到目標擊中為止的總射擊次數;E4:測量一個工人生產的電燈泡的壽命,試驗的結果是t小時.如果假定燈泡的壽命不超過5000小時,則t是區間[0,5000]中的某個數值.這四個實驗均滿足隨機試驗的三個條件,而實驗“記錄100年后地球上的人口數量”卻不是隨機試驗,因為實驗無法在相同的條件下重復進行.
二、樣本空間
對于任一個隨機試驗,每次實驗的所有可能結果都是事先知道的,而且結果不止一個.把隨機試驗的一切可能結果的集合稱為樣本空間.在概率論中常用大寫的希臘字母Ω來表示.試驗的每個結果稱之為樣本點或基本事件,通常用小寫的希臘字母ω或ω1,ω2,.來表示.例1.1.1中4個隨機試驗的樣本空間分別為 Ω1={H,T},其中H表示正面,T表示反面;Ω2={HH,HT,TH,TT};Ω3={0,1,2,.};Ω4={t|0≤t≤5000}.由上述可知,樣本空間可以是有限點集,可以是可列點集(即它可以與自然數集 是一一對應的集合),也可以是某區間或平面上的一個區域.其中,隨機試驗E1的樣本空間是一維的,E2的樣本空間是二維的,它們的樣本點為有限個.
1.1 隨機事件
三、隨機事件
在實際問題中,我們往往關心某種滿足一定條件樣本點的集合,這種滿足一定條件樣本的集合稱為隨機事件,簡稱事件.所以隨機事件就是某些樣本點的集合,也就是樣本空間Ω的某些子集合.在試驗時,如果出現了事件A中的樣本點,我們就說事件A發生了或者說A出現了.例如,
(1)在E1中事件A表示“出現正面”,即A={H};
(2)在E4中事件B表示“電燈泡的壽命在3000至4000小時之間”,即B=[3000,4000].
Ω作為自身的子集合,在每次試驗中總是發生的,稱為必然事件;空集•不包含任何樣本點,在每次試驗中總是不發生,稱為不可能事件.事件通常用大寫的英文字母A,B,C,.來表示,其具體內容可寫為A={.},其中大括號中或者是A所包含樣本點的列舉,如上面的A,或者是對A中樣本點所具有的性質的描述,比如在例1.1.1的E3中,設C為射擊次數不超過5次的事件,那么可寫C={ω∈Ω:ω≤5}.事件B也屬于這種情況,不過我們用一個閉區間[3000,4000]表示“3000≤ω≤4000”.
四、事件間的關系與運算
事件既然是Ω的子集合,它們之間的關系與運算就是集合間的關系與運算.下面設A,B,A1,A2,.均為事件.
(1)若A炒B,則稱B包含事件A或A含于B.這表示事件A發生必導致B發生,若A炒B,且B炒A,即A=B,則稱事件A與B相等.
(2)事件A∪B={ω∈Ω:ω∈A或ω∈B},稱為事件A與B的并事件.也就是把兩事件的樣本點放在一起所組成的新事件.因此,A∪B發生當且僅當A,B中至少
n 有一個發生,類似地,稱i ∪= 1 Ai={ω∈Ω:ω至少屬于A1,A2,.,An中一個事件}為n個∞ 事件的并事件,稱i∪= 1 Ai={ω∈Ω:ω至少屬于A1,A2,.中一個事件}為可列個事件的并事件.
(3)事件A∩B={ω∈Ω:ω∈A并且ω∈B}稱為事件A與B的交事件,簡記為AB,也就是兩事件中公共的樣本點所組成的事件,因此AB發生當且僅當A與B同時發生.n類似地,稱i ∩= 1 Ai={ω∈Ω:ω屬于一切Ai,i=1,2,.,n}為n個事件的交事件,稱i ∩=∞1 Ai={ω∈Ω:ω屬于一切A1,A2,.}為可列個事件的交事件.
(4)事件A-B={ω∈Ω:ω∈A但ω臭B}稱為事件A與B的差事件,事件A-B發生當且僅當A發生,而B不發生.
(5)若A∩B=•,則稱事件A與B互不相容或互斥,即兩事件不能同時發生.
(6)若A∪B=Ω,且A∩B=•,則稱兩事件互為逆事件,并記B=A•或A = B•.事件的關系與運算可用圖1.1來表示.
圖1.1 事件的運算滿足下列定律:
(1)交換律:A∪B=B∪A, A∩B=B∩A;
(2)結合律:A∪(B∪C)=(A∪B)∪C,A∩(B∩C)=(A∩B)∩C;
(3)分配律:A∩(B∪C)=(A∩B)∪(A∩C),A∪(B∩C)=(A∪B)∩(A∪C);
(4)對偶律:A ∪ B = A•∩ B•, A ∩ B = A•∪ B•.
這些定律均可用嚴格的數學方法證明,即證明等式兩邊的事件相互包含.但是用圖示的方法驗證這些定理會顯得更加直觀.例如,圖1.2中的A∪B即為方框中陰影部分,而如果你把A的外面涂上紅色,把B的外面涂上藍色,那么既有紅色又有藍色的部分恰是方框中的陰影部分.
根據事件的關系與運算規則可用一些簡單的事件來表示較復雜的事件.
1.2 概率的定義
例1.1.2 某燈泡廠取樣檢查燈泡的壽命,設A表示“燈泡壽命大于1500h”,B表示“燈泡壽命為1000~2000h”,請用集合的形式寫出下列事件:Ω,A,B,A∪B,AB,A-B,B-A.
解 Ω={x|x≥0}=[0,+∞), A={x|x>1500}=(1500,+∞),B={x|1000≤x≤2000}=[1000,2000], A∪B=[1000,+∞),AB=(1500,2000], A-B=(2000,+∞), B-A=[1000,1500].
例1.1.3 一個貨箱中裝有12只同類型的產品,其中3只是一等品,9只是二等品,從中隨機地抽取兩次,每次任取1只,Ai(i=1,2)表示第i次抽取的是一等品,試用字母及事件間的關系表示下列事件:
(1)兩只都是一等品;
(2)兩只都是二等品;
(3)一只是一等品,另一只是二等品;
(4)第二次抽取的是一等品.解由題意,用A•i表示第i次抽取的是二等品(i=1,2),
則
(1)兩只都是一等品:A1∩A2;
(2)兩只都是二等品:A•1 ∩ A•2;
(3)一只是一等品,另一只是二等品:A1A2∪A1A2;
(4)第二次抽取的是一等品:A•1A2∪A1A2=A2.例1.1.4 甲、乙、丙三人各向目標射擊一發子彈,以A,B,C分別表示甲、乙、丙 命中目標,試用A,B,C的運算關系表示下列事件.
A0:“甲命中,乙和丙都沒有命中” AB•C•;
A1:“至少有一人命中” A∪B∪C;
AB •A •
A2:“恰有一個命中目標” AB•C•∪•C ∪•BC ;
A BC ∪ A •
A3:“恰有兩個命中目標” ABC•∪•BC ;
A4:“最多有一個命中目標” B•C•∪ A•C•∪ A•B•;
A5:“三人都命中目標” ABC;
A6:“三人均未命中目標” A•B•C•.
注 事件的表示不是唯一的,例如,利用對偶律或事件的差,例1.1.4中事件A0 也可表示為如下幾種形式:A0=A(B ∪ C) , A0=A-B-C.
1.2 概率的定義
1.1節介紹了隨機現象,通過大量試驗可以觀察到會有哪些結果出現.實際上,我們更希望能對這些結果出現的可能性作出定量的描述.事件發生可能性的定量描述的實質就是事件發生的概率.有些事件發生的概率直覺就可以確定,但是,對于一 般事件而言,單憑直覺來確定其發生的概率顯然是行不通的.
一、概率的統計定義
人們經過長期的實踐發現,雖然一個隨機事件在某次試驗或觀察中可能發生也可能不發生,但在大量重復試驗中,它發生的可能性的大小卻能呈現出某種規律性. 我們感興趣的正是對這種規律性的探討.
1.頻率的穩定性
若事件A在n次試驗中發生了nA次,則稱nA為事件A在這n次試驗中發生的 頻數,而比值fn(A)=nnA稱為事件A在這n次試驗中發生的頻率.很早人們就注意到,在多次拋擲一枚質地均勻的硬幣時,出現正面這一隨機事件發生的頻率會接近1/2.請看下面“拋擲硬幣”試驗的實例,見表1.1.表1.1
實驗人 拋擲次數 出現正面次數 頻率(出現正面次數/拋擲次數)
德摩根(DeMorgan)蒲豐(Buffon) 20484040 10612048 0.51810.5069
皮爾遜(Pearson) 24000 12012 0 .5005
表1.1說明:當試驗的次數n增加時,正面向上的頻率,即正面出現的次數k與 總的試驗次數n之比kn 將隨n的增大而逐漸逼近12 .
頻率偏離這個常數很大的可能性雖然存在,但是試驗的次數n越大,則頻率偏離這個常數的可能性越小,也就是說,隨機事件的每一次觀察結果都是偶然的,但是多次觀察某個隨機現象可以知道,在大量的偶然事件中存在著必然的規律.
通過大量的試驗可知,在重復試驗的次數n充分大時,事件的頻率總是在一個固定數值p附近擺動,我們將這種特性稱為頻率的穩定性.頻率的穩定性是一個客觀存在,它不斷地為人們所證實.例如,多年醫學研究表明,出生嬰兒性別的數量比約為男∶女=1.06∶1;英語字母E,T,A出現的頻率要明顯高于其他字母.因此人們常用統計頻率作為概率的近似值.
2.頻率的性質
頻率具有下列性質:
性質1.2.1 對于任一個事件A,有0≤fn(A)≤1.
證 設nA表示n次試驗中A發生的次數,則有0≤nA≤n,從而0≤nnA ≤1, 即
0≤ fn (A )≤1 .