概率论与数理统计简明讲义 概率论基础
5. 对立事件的概率计算公式: )(1)( APAP −= ;
6. 概率的加法公式: ;
( ) () () ( )PA B PA PB PAB=+−U
7. 概率的乘法公式:
,如果 。
( ) ()( | )PAB PBPAB= () 0PB >
8. 全概率公式:
,如果 ,
)|()()(
1
i
i
i
BAPBPAP
∑
+∞
=
= Ω=
+∞
=
U
1i
i
B
ij
BB
=
( i )。 j≠
注:利用全概率公式可把复杂事件的概率化为互斥的简单事件的概率来计算。
9. Bayes 公式:
∑
∞+
=
==
1
)|()(
)|()(
)(
)(
)|(
i
ii
jjj
j
BABBP
BAPBP
AP
ABP
ABP ,如果 ,
Ω=
+∞
=
U
1i
i
B
ij
BB
=
( )。 i≠ j
注:知道结果找原因用 Bayes 公式计算。
由概率的公理化定义以及条件概率的数学定义,不难证明上面概率的性质和计算公式。
我们更希望大家熟练运用它们解决实际问题。下面是一些范例:
问题 0.6:用甲胎蛋白法诊断肝癌,灵敏度是 95%、特异度是 90%。如果在某次例行检查(譬
如单位每年一度的体检)中,某人的检验结果是阳性,试问:他应该沮丧到什么程度?
答案是令人惊讶的,他甚至应该保持谨慎乐观的态度。为什么呢?我们只须计算出检验
结果是阳性的条件下他患肝癌的概率就可以了。
现在已知的只是癌症患者检测结果呈阳性的概率和正常人检测结果呈阴性的概率,为了
利用 Bayes 公式计算检验结果是阳性的条件下他患肝癌的(后验)概率,还需要知道人群中
肝癌的罹患率。根据广州市 1999 年的调查资料,我们可以假设人群的肝癌发病率大约为
0.02%,则由 Bayes 公式容易得到他患肝癌的条件概率为
%19.0
%)901(%)02.01(%95%02.0
%95%02.0
=
−×−+×
。
这么小的概率自然不值得他担心。
不过要注意,如果他复查时检验结果还是阳性,则他患肝癌的概率将增加到 1.78%。
问题 0.8:为确定什么样的性行为最容易导致爱滋病,需要了解人群中进行过某种性行为的
人所占的比例。试问:如何设计调查方案?
最简单的调查方案是:随机调查 n 人,如果其中回答“是”的有 k 人,则比例 p 的一个估
计为 。但是这样得到的估计值往往偏低,因为显然有人会说谎!现在面对的是社
会调查中的一类特殊问题,属敏感性问题调查。设计调查方案,关键一点是要保护个人隐私,
被访者才有可能真实作答。下面给出两种可行的设计方案,大家可以做一比较。
nkp /
ˆ
=
方案
1:准备一密封罐,罐中装有若干红球和白球(已知红球的比率为
)。随机调查 n
人,先摸球再答题。若摸得红球,则须如实回答;否则说谎。
记回答“是”的人数为 k,则由全概率公式得 P(是)=P(上)P(是|上) +P(下)P(是|下)。
于是当 n 充分大时,我们有
)1)(1( ppnk
=
。
解之得,p 的估计为
12
)1(
ˆ
−
−−
=
π
nk
p
。
请注意,本方案首先要求
21≠
;进一步,
该如何选择,得到的 p 的估计比较好?
方案
2:准备一密封罐,罐中装有若干红球和白球(已知红球的比率为
)。随机调查 n
人,先摸球再答题。若摸得红球,则须如实回答;否则回答另一问题:生日是否在上半年?
记回答“是”的人数为 k,则由全概率公式得 P(是)=P(上)P(是|上) +P(下)P(是|下)。
于是当 n 充分大时,我们有
2)1(
= pnk
。
解之得,p 的估计为
π
2)1(
ˆ
−−
=
nk
p
。
方案 2 要求
0
。一个遗留的问题是:
又该如何选择,得到的估计较好?
我们都听说,吸烟危害健康。到底怎么回事呢?还是让数据说话吧!
问题 1.2:1950 年某地区曾对 50—60 岁的男性公民进行调查,结果发现,肺癌病人和无肺