数学文化经典概率论统计文化节 Microsoft Word 文档

更新时间:2023-11-01 11:26:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1

数学文化经典--概率统计文化

●概率统计基本思想方法 一 、研究对象:不确定性现象

不确定现象是相对确定性现象而言的。 1、确定性现象

确定性现象指的是“在一组条件下必然发生或不发生的现象” 例如,

⑴ 向上抛一枚硬币,观察落地时所经过的时间; ⑵ 在标准大气压下,水温加热到100°c,观察水面就会看到沸腾;

⑶ 测量一个平面三角形的内角和,必然为180°

??

此类现象的特点是,在一定条件下,其结果是唯一确定的,我们可以根据过去的状态,预测将来的发展。

2、不确定性现象

现实世界中存在大量不确定性现象。 例1、

⑴ 上抛一枚硬币,观察落地后向上一面的情况;

有两种结果:正面向上,反面向上

⑵ 掷一颗骰子,观察向上点数;有1-6六种可能结果; ⑶ 同时掷两颗骰子,观察向上点数;

2

共有 6=36 种结果

⑷ 从某灯泡厂某天生产的灯泡中抽100只检测,记录不合格品数;

所可能的结果有0-100共101种

⑸ 某机场在一天内进出的旅客数;

其可能结果为:0、1、2、?n、 ?(无限多种结

果,(可数个))

⑹ 向某目标发射一发炮弹,观察弹着点与目标的偏差。

结果可能是区间[0,a)内的数。(无限多种结果,

(不可数个))

此类现象的特点是,在一定条件下,其结果不只一个,并且,究竟会出现那种结果,事前无法知道。我们称此类现象为不确定现象,也称随机现象。随机现象具有偶然性,我们无法像确定性现象那样应用数学公式、物理定律给予严格、准确地概括,利用因果关系给予预测。 二、研究任务: 随机现象的统计规律 (一)、随机现象中事件的概率

1、随机现象中各种结果出现的“可能性大小”是客观存在的

虽然随机现象具有偶然性,但是,偶然中包含着必然。随着认识的深入,人们通过“大数次”重复试验发现,随机现象中的各种可能的结果呈现出某种规律性。

2

3

例如,历史上有著名的抛币试验: 实验者 上抛数 正面 反面 差 “正面向上”的频率 56 38 24 0.5069 0.5016 0.5005 向上数 向上数 1992 5981 11988 Buffon 4040 Pearson 12000 2048 6019 Pearson 24000 12012

从试验可以看到,在大数次试验中,“正面向上”这一结果(我们称为事件,事件用大写字母A、B、C?来表示)出现的可能性大小接近1/2(事件“反面向上”也有类似结论)。这就表明,虽然随机现象有多种可能结果,而且事前并不能确定何种结果会发生,但各种结果出现的“可能性大小”是客观存在的,我们称一种结果(事件)出现的“可能性大小”为该事件的概率,用大写字母P表示。例如,在抛币试验中,事件A=“正面向上”的概率记为P(A)=1/2。 它是随机现象的数量特征。这就为我们研究随机现象的数量规律提供了基础。

2、事件的概率是介于0到1中的一个数

既然事件的概率是它发生的可能性大小,我们就用一个百分数来表示,因此事件的概率是介于0到1中的一个数。

4

(二)概率分布

1、 随机变量

为了对随机现象中各种结果发生的“可能性大小”进行数学处理,人们引进了随机变量的概念。它是以事件为自变量的一个函数,用大写字母X、Y、Z?表示。例如,在掷骰子试验中,掷一颗骰子,观察向上点数有1-6六种可能结果,我们称每一种结果为基本事件,用?来表示。这样,在掷骰子试验中的6种结果记为:?i?i,i?1,2,3,4,5,6。于是,我

们随机变量X表示上述结果,其对应关系为:对每个基本事件?i 有唯一确定的数对应X的取值i与之对应,即:

基本事件 随机变量X有取值

?1 1 ?2 2

??

?6 6

当试验中出现?i时,随机变量X取值i,反之,当随机变量X取值i时,意味着使得随机变量X取值i的那些基本事件中的一个在试验中发生了。在通常的函数关系y?f?x?中,自变量x取值确定,函数y的取值随之确定。但在随机现象中,基本事件的出现是随机的因而X的取值也是随机的,这就是称这里的变量为随机变量的原因。

5

2、 概率分布

对于一个随机现象,它的所有结果出现的可能性大小其数值的总和为1。而我们在研究随机现象的数量规律时,我们不但要研究各种结果出现的“可能性大小”(即每个事件概率的大小),还要弄清概率“1”是怎样分布在各种结果上的。例如,在掷骰子试验中,用古典概率可以知道,出现1-6中的每个点的概率都为1/6,因此随机变量X所有可能的为取值1、2、3、4、5、6,而X取上述各数的概率均为,1/6,将这一结果列成下面的表:

X的取值 X取相应值的概率

上面的表称随机变量X的分布,由表可见,我们不但可清楚地看见各种可能结果的概率是多少,看到总的概率“1”是如何分布在各种结果上的,而且还可计算X在任意范围内取值的概率是多少,从而为我们在抉择时提供依据。

我们称一种随机现象各种可能结果出现的大小连同概率是如何分布的结果为该随机现象的统计规律,它是概率统计的研究任务。

三、研究的方法:随机试验和模型

通过随机试验来展开对随机现象的研究,建立不同的随

1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/6

16

Y y-x=5 60 x-y=10

5 0 10 60 x 而事件A发生

???x?y?10?y?x?5 此不等式组即图中阴影部分区域,故

P?A??2?60?60?2500?30252?60?60=0.2324 3、 n重贝努里概型 (1)贝努里试验

如果一个试验满足下面两个条件:

⑴只有两个可能结果:A=“成功”及B=“失败”; ⑵ P(A)=p,P(B)=1-p=q , (0<p<1) 则称为贝努里实验。 (2)n重贝努里概型

将一个贝努里试验独立地、重复做n次的试验模型,称为 n重贝努里概型,简称贝努里概型。 问题:在n重贝努里试验中,事件:

17

“A在n次试验中发生K次” (K=0,1, ?,n)的概率是多少?

在n重贝努里试验中,事件“A在n次试验中恰好发

kkP(k)?C1?P?生K次” 的概率为: nnP?n?kk=0,1, ?n

由于概率 Pn?k?(k=0,1, ?n)恰为二项式 ?p?q?n的展开式中的各项,所以称其为二项分布。

下以 n=3为例,讨论事件“恰好成功K次” 的概率。 n=3时,表明将一个贝努里试验独立地、重复地做了三次,若令

Ai=“第i次成功”, i=1,2,3,则样本空间包含了8个样本点:

???A1A2A3;A1A2A3,A1A2A3,A1A2A3;A1A2A3,A1A2A3,A1A2A3;A1A2A3?它们一共可分为4类,分别表恰成功0,1,2,3次,下面分别计算其概率: P3?0??P?P?A1?P?A2?P?A3?(由独立性得)

003?q?q?q?q3?C3pq???P?AAA??P?AAA???AAA?

P3?1??PA1A2A3?A1A2A3?A1A2A3123123123

1?pq2?pq2?pq2?3pq2?C3pq2P3?2??PA1A2A3?A1A2A3?A1A2A3?3p2q?C32p2q??18

330P3?3??P?A1A2A3??p3?C3pq1?pq2?pq2?pq2?3pq2?C3pq2例9、某工厂一天出废品的概率为0.2,现对连续1周

(5天)的生产情况进行考察,问:

(1)A=“5天中仅有一天出废品”的概率是多少? (2)B =“在5天中至少有一天出废品”的概率是多少? (3)C =“在5天中第4天第一次出废品”的概率是多少? 解:

由于对一天的生产情况而言,要么“出废品”(设为A),要么“未出废品”(设为B ),则P(A)=0.3=p,

P(B)=0.8=q系贝努里试验,于是,试验为5重贝努里试验。 (1)A即“恰有1天出废品”,故

144Cpq?5?0.2?0.8?o.4096 P(A)= P5(1)= 5⑵ 至少有一天出废品,即有1、2、3、4天或5天出废品

⑶题即前1、2、3天均未出废品,而第4天出废品,故

P(B)?P5(1)?P5?2??P5?3??P5?4??P5?5???P5?k??1?P5?0??1?C50p0q5k?15?1?0.85?0.6723219

P?C?? 0.8 × 0.8 × 0.8 ×0.2=0.1024

例10、若在一年中,拳击运动员的死亡率是1%,现有500名拳击运动员参加了人寿保险,试求A=“在未来一年中这些保险者死亡人数不超过3人”的概率。

解:对任一保险者而言,在未来一年中要么“死亡”(设为A),要么“未死亡”(设为B ),则P(A)= 0.01 =p, P(B)=0.99=q,可看成一个贝努里试验。由于保险者中是否 “死亡”是彼此独立的,于是本问题归结为500重贝努里试验。

事件“不超过3人”包括恰有0、1、2、3人四种情况,则所求概率为:

p??P500?k??P500?0??P500?1??P500?2??P500?3?k?03

要计算这一概率计算量较大。经研究,人们获得一个近似计算公式,为此介绍另一重要概型——普阿松概型。 4、普阿松概型

(1)“流”: 人们把某一观察对象在时间进程中随机出现的现象称为“流”。

例如,电话交换台在一定时间内接到的呼唤数;某放射 性物质在一定时间放射出的粒子数;某机场在一定时间起落 的飞机数等。

20

在一个“流”中,人们关心的是在“单位时间”内出现对象数的概率。 (2)最简单流 如果一个流满足:

① 平稳性:即在时间(a , a+t ]内出现的对象数只与时间长度t 有关,而与时间起点a 无关;

② 有限性:在有限时间区间内,只出现有限个对象; ③ 无后效性:即在不相交的时间区间内,事件“出现的对象数”相互独立;

④ 普通性:当时间区间△t充分小时,出现1个以上对象的概率是△t的高阶无穷小。

则称满足以上4个条件的“流”为最简单流。 (3)普阿松公式

法国数学家普阿松证明了,在最简单流概型中,事件“在单位时间内出现k个对象”的概率为:

p??k???kk!e??,? >0

k=0,1,2, ?

(4)普阿松定理

npn??( ﹥0是 设 ?p?是一个数列,且

n?常数)则:

26

那一轮轮关税贸易总协定多边谈判旨在不断消减的关税税率其计算也是平均法的应用。

数学期望

(一)离散型r.v的数学期望 问题:

一个车间共有5台机床,这些机床由于各种原因时而工作时而停顿,因此,任意时刻工作着的机床数是一个r.v。为精确估计车间的电力负荷,我们需要知道车间在任一时刻同时工作的机床平均数。

下面是20次观测结果:

工作着的机床数 0 频 数 0 频 率 0

显然,工作着的机床数为一个随机变量X,它可能取值为0,1,2,3,4,5,上表显示的数据在20次观察中X取值的平均值为:

S=(0×0+1×0+2×1+3×2+4×6+5×11)/20 ?0?0012611?1??2??3??4??5?=4.35 2020202020201 0 0 2 1 3 2 4 6 5 11 1/20 2/20 6/20 11/20 即,平均值等于X的取值与相应的频率乘积之和。很明

27

显,这一结果只能是一个近似值,其原因是由频率的误差造成的,为了消除此误差,注意到频率的本质是概率。因此我们用X取各数的概率去代替频率,便可得到精确的平均值。这样,我们把随机变量X取各可能值与相应的概率值的乘积之和称为X的数学期望(或均值),它代表了随机变量X取值的平均水平,其实质是:随机变量X取值关于其概率的加权平均数。一般地有: 随机变量的数学期望

x 若离散型随机变量X的可能取值为: 1,x2,?xn?P 相应概率为: 1,P2,?Pn,?称和: x1?p1?x2?p2??xn?pn??为X的数学期望,记为E(X):

随机变量的方差

EX??xipii?1? 数学期望反映了随机变量X取值的一般水平。设=a,显然,X的取值不一定恰好是E(X),一般情形下存在偏差 “X- E(X)”, 偏差的大小会对随机变量X取值的一般水平产生影响。 问题:

有甲、乙两种牌号的手表,它们的日走时误差分别由 随机变量X和Y反映,其分布列为:

??101?X:??0.10.80.1??????2?1Y:??0.10.2?2??0.40.20.1??0128

要比较它们走时准确性的优劣,可考虑比较其平均水平即均值。但经计算,

E(X)=(-1)×0.1+0×0.8+1×0.1=0

E(Y)= (-2)×0.1+(-1)×0.2+0×0.4+1×0.2+2×0.1 =0

即两者的均值相等,根据随机变量看不出结果。但从直观上看,甲型牌号手表误差为0的占80%,其余20%,,分散在EX两侧(±1秒);而乙型牌号仅有40%的误差为0,却有60%,分散在两侧,且分散范围比甲型大(±2秒),这表明甲牌型号手表走时误差较稳定。误差角度看甲型牌号手表优于乙型牌号.如何用数学语言来反映随机变量X与它的均值E(X)的偏差这种分散程度呢?

容易知道,用差X-E(X )可以反映这种分散程度,但此差有正有负,在多个数相加情形可能会因正负抵消而看不出结果。于是可考虑加上绝对值,但绝对值在运算中不方便,进而可考虑(X-E(X ))。不过,X取值具随机性,其平方值具有不确定性,为消除不确定因素,可考虑此值的数学期望。这样,式子E(X-E(X ))考虑反映了随机变量X取值的分散程度,我们称之为X的方差。

设X是一个随机变量, 则称E(X-E(X))为随机变量X的方差,记为D(X),即

2

2

2

2

D(X)=E(X-EX)

29

并称 为X的标准差。 D?X?注:

(1)方差D(X)系随机变量X的函数[X-EX] 取值的平均值,它反映了随机变量X对于E(X)的偏离程度,方差与标准差的功能相似,都是用来描述随机变量X取值的分散程度(即散布大小)的两个特征数,方差或标准差愈小, 随机变量X的取值愈集中,反之,取值愈分散.

(2)方差与标准差的差别在量纲上,后者与期望的量纲相同,实际中人们更乐意选用标准差.

(3)如果E(X)存在, D(X)不一定存在,但若D(X)存在,那么E(X)必定存在。 例10:

某人有一笔资金,可投入两个项目:房产和商业,其收益都与市场状态有关。若未来市场分好、中、差三个等级,其发生的概率分别为0.2,0.7,0.1。通过调查,该投资者认为投资于房产的收益X(万元)和投资商业的收益Y(万元)的分布分别为:

问该投资者如何投资为好?

解:首先考察数学期望(平均收益)

3?3??11X:??0.20.70.1????2

?64?1?Y:??0.20.70.1????30

E(X)=11×0.2+3×0.7+(-3)×0.1=4 .0(万元)

E(Y)=6×0.2+4 ×0.7+(-1)×0.1=3.9 (万元) 从平均收益看,投资房产收益大,比投资商业多0.1万元。

D(X)=(11-4)×0.2+(3-4)×0.7

+(-3-4)×0.1=15.54

D(Y)=(6-3.9)×0.2+(4-3.9)×0.7

22

2

2

2

2

+(-1-3.9)× 0.1= 3.29

D?X??15.54?3.92,D?Y??3.29?1.81

从标准差看,投资房产的风险比投资商业的风险大一倍多,从收益和风险综合权衡,投资商业为好。 ● 概率论的基本内容

概率统计包含概率与统计两个部分,它们分别从两个不同的角度开展对随机现象的研究。前者以演绎方式,后者以归纳方式.

概率论源于对赌博的研究。最初,关于分赌本的问题有人请教费尔马与帕斯卡,经他们通信探讨后从不同角度得到共同的解答。

分赌本的问题:

十七世纪,法国有两位狂热赌徒麦拉和保罗有次按下面方式赌博:首先各拿6枚金币放在一起作为赌本,约定谁先胜3局便获全部12枚金币。当麦拉胜2局,而保罗胜局后

41

无偏性:

设?是总体参数?的一个估计量,如果满足E(?)=?,则称?是一个无偏估计。

有效性:

设?1和?2是总体未知参数?的两个无偏估计,如果有 D(?1)<D(?2)则称?1比?2更有效。 2、区间估计

点估计是用一个数去估计总体未知参数,它的优点是简单易行,其缺点是无法知道估计的精度和可靠性。为此,我们设法寻求两个估计量?1和?2组成一个区间〔?1,?2〕,用以盖住总体X的未知参数?,这样,区间长度?1-?2便反映了估计的精度。显然,?1-?2越小,其精度越高。但?1-?2变小时,可能导致区间〔?1,?2〕无法盖住?,即估计的可靠性下降,而要提高估计的可靠性,又必须让?1-?2变大,这又使得估计的精度变低。为解决这一矛盾,只好放弃让〔?1,?2〕百分之百地盖住?的目标,退而考虑使〔?1,?2〕以某个较大的概率1-?(?是一个小概率)盖住?就行了,即使其成立: P(?1≤?≤?2)=1-?,称满足上式的区间〔?1,?2〕为置信度(或置信水平)为1-?的置信区间。其中, 1-?称置信水平。用置信区间估计?的方法叫区间估计。

例15:

某厂生产的化纤强度服从正态分布,长期以来其标准差

???????????????????????????????42

稳定在?=0.85.现抽取了一个容量为n=25的样本,测定其强度,算得样本均值为x=2.25,试求这批化纤平均强度置信水平为0.95的置信区间。

分析:由题设,总体X=“化纤强度”~N(?,0.85), 要求?1,?2,使P(?1≤?≤?2)=1-?,这里,1-?=0.95, 由于x是取自X准化得:U?x????2的样本平均,所以x~N???,n????,将其标??????n~N?0,1?

对于1-?,查正态分布表可得满足下式的u1??,如图,

2即1-?= P(-u1??≤x??≤u1??)

2?2n????? =P??u1???X???u?? ?nn2?2? =P??????nu????X?2??u?? ?n2? =P??X????nu????X?2??u??n2??

????于是得到所求置信区间为?X?u????X?u??

n2n2??在本题中,由1-?=0.95得?=0.05,?=0.025,

21-?=0.975

2查标准正态分布表知u1??=1.96

2将u1??=1.96,?=0.85,n=25,x=2.25代入

243

得到x-

?nu0.85=2.25-×1.96=1.9168 ?1?225x+?un1??2=2.5832

从而得到所求置信区间为﹝1.9168,2.5832﹞ 三、假设检验

问题:

某车间所生产的铆钉,根据以往的生产情况,其总体

X~N(?,?2),已知平均直径?0=2,标准差?0=0.1(厘米)。

现在又采用一种新工艺,在用新工艺生产的铆钉中抽取容量

n=100

个的样本,测得其平均直径为x=1.978(厘米).问:

采用新工艺生产的铆钉的平均直径是否与以前的平均直径相同?

我们知道,即使工艺条件不变,所抽取的样本直径也不会等于?0=2,而是在?0附近波动。因此自然要问,x与?0的差异是纯属偶然波动,还是工艺改变的影响?这里有两个命题,如果用?表示新工艺生产的铆钉的平均直径,那么,究竟是?=?0成立,还是?≠?0成立?即提出假设

H0:?=?0;H1:?≠?0

这就是一个假设检验问题。那么,如何检验呢? 假设检验基本思想方法

假设检验依据的是小概率事件原理。 小概率事件原理

44

小概率事件在一次试验中是不可能发生的。

例如,某公司声称其产品的合格率为99.9%(H0),为检验其是否真实,今从中任意抽取5件检测。假设H0正确,那么5件全部合格的概率为0.995=0.995,而5件中至少有一件不合格的概率为1-0.559=0.005是一个小概率事件。如果在5件产品中发现有1件不合格品,我们有理由推翻H0,从而做出拒绝H0而接受H1,(即合格率未达到99.9%)。当然,这样做我们冒了千分之五的风险,因为毕竟还是有0.005的概率使被抽5件产品中出现不合格品。

检验思想方法及其检验步骤

我们已看到x与?0存在差异。常识告诉我们,若?=?0成立,则差异x??0比较大的可能性小,而x??0比较小的可能性大。故可根据x??0的大小来判断H0是否成立,这就要分析H0成立时x??0大到什么程度,即大于什么值C时是一个小概率事件?,这当然要根据x??0的分布来求。如果这个值C找到了,比如

P(x??0>C)= ?(?一般取0.05,0.01等),那么就可根据观测值计算x??0,如果x??0>C,即小概率事件发生了,则拒绝H0而接受H1,反之则接收H0而拒绝H1。

显著性检验步骤 1、建立系统假设H0

2、构造一个合适的统计量U,使U的分布已知。

5

45

3、规定一个小概率?(称显著性水平),求在H0成立条件下满足

P(U≥u1??)=?

2的临界值u1??

24、由样本观察值计算U的观察值u,如果

u≥u1??

2??则拒绝H0,否则接受H0,这里,区域????,?u1?????u1???2?????2?,????称?拒绝域。

在本例中,当H0成立时 X~N(?0=2,?02?0.12) 故 X~N(?0,“标准化”

U=

X??0?02n)

?0n~N(0,1)

若取?=0.05,u1??=1.96,x=1.978,?0=2

2故 u=

x??0?n?2=1.978=2.2>1.96 0.1100故拒绝H0,即认为采用新工艺后,平均直径不再等于?了。 两类错误

本文来源:https://www.bwwdw.com/article/oi22.html

Top