概率论与数理统计公式整理(超全免费版)

更新时间:2023-12-16 09:54:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第1章 随机事件及其概率

(1)排列组合公式 m! 从m个人中挑出n个人进行排列的可能数。 (m?n)!m!n 从m个人中挑出n个人进行组合的可能数。 Cm?n!(m?n)!nAm?(2)加法和乘法原理 加法原理(两种方法均能完成此事):m+n 某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。 乘法原理(两个步骤分别不能完成这件事):m×n 某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m×n 种方法来完成。 重复排列和非重复排列(有序) 对立事件(至少有一个) 顺序问题 如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。 试验的可能结果称为随机事件。 (3)一些常见排列 (4)随机试验和随机事件 在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质: ①每进行一次试验,必须发生且只能发生这一组中的一个事件; (5)基②任何事件,都是由这一组中的部分事件组成的。 本事件、这样一组事件中的每一个事件称为基本事件,用?来表示。 样本空基本事件的全体,称为试验的样本空间,用?表示。 间和事一个事件就是由?中的部分点(基本事件?)组成的集合。通常用大写字母A,件 B,C,?表示事件,它们是?的子集。 ?为必然事件,?为不可能事件。 不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。 ①关系: 如果事件A组成部分也是事件B的组成部分,(A发生必有事件B发生):A?B 如果同时有A?B,B?A,则称事件A与事件B等价,或称A等于B:A=B。 A、B中至少有一个发生的事件:A?B,或者A+B。 属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表(6)事件的关系与运算 示为A-AB或者AB,它表示A发生而B不发生的事件。 A、B同时发生:A?B,或者AB。A?B=?,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件是互不相容的。 ?-A称为事件A的逆事件,或称A的对立事件,记为A。它表示A不发生的事件。A?B=?,A?B=? 互斥未必对立。 常用公式:A?AB?AB ②运算: 交换律:A∪B=B∪A AB=BA 结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C 分配率:(AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC) 德摩根率:i?1?A??Aii?1??i A?B?A?B,A?B?A?B 频率:fn(A)=nA 性质: n(1)0?fn(A)?1;(2)f(S)?1,f(?)?0;(3)若A1,A2,?,Ak是两两互不相容的事件,则f(A1?A2???Ak)?fn(A1)?fn(A2)???fn(Ak)n?? 随机波动性 和 稳定性。 频率 (波动)????概率(稳定). 概率:设?为样本空间,A为事件,对每一个事件A都有一个实数P(A),若满足下列三个条件: 1° P(A)≥0 2° P(Ω) =1 3° 对于两两互不相容的事件A1,A2,?有 (7)概率的公理化定义 ????P???Ai????P(Ai)?i?1?i?1常称为可列(完全)可加性。 则称P(A)为事件A的概率。 概率性质: (1)0?P(A)?1,P(S)?1,P(?)?0; (2)若A1,A2,?,An是两两互不相容事件,则有 P(A1?A2???An)?P(A1)?P(A2)???P(An). (有限可加性) (3)设A,B为两个事件,且A?B,则P(A)?P(B),P(B?A)?P(B)?P(A).(4)设A是A的对立事件,则 P(A)?1?P(A). (5)(加法公式)对于任意两事件A,B,有P(A?B)?P(A)?P(B)?P(AB). P(A1?A2?A3)?P(A1)?P(A2)?P(A3)?P(A1A2)?P(A2A3)?P(A1A3)?P(A1A2A3). P(A1?A2???An)??P(Ai)?i?1n1?i?j?n?P(AiAj)?1?i?j?k?n?P(AiAjAk)???(?1)n?1P(A1A2?An). ?1,?2??n?, 2° P(?1)?P(?2)??P(?n)?1° ???(8)古典概型 设任一事件A,它是由?1,?2??m组成的,则有 1。 nP(A)=?(?1)?(?2)???(?m)? =P(?1)?P(?2)???P(?m) ?mA所包含的基本事件数? 基本事件总数n(9)几何概型 (10)加法公式 (11)减法公式 若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件A,P(A)?L(A)。其中L为几何度量(长度、面积、体积)。 L(?)P(A+B)=P(A)+P(B)-P(AB) 当P(AB)=0时,P(A+B)=P(A)+P(B) P(A-B)=P(A)-P(AB) 当B?A时,P(A-B)=P(A)-P(B) 当A=Ω时,P(B)=1- P(B) 定义 设A、B是两个事件,且P(A)>0,则称P(AB)为事件A发生条件下,事件BP(A)(12)条件概率 发生的条件概率,记为P(B/A)?P(AB)。 P(A)条件概率是概率的一种,所有概率的性质都适合于条件概率。 P(B|A)?0,P(S|A)?1,若B1,B2?两两互不相容P(?Bi|A)??P(Bi|A) i?1i?1??P(B1?B2|A)?P(B1|A)?P(B2|A)?P(B1B2|A) (13)乘法公式 乘法公式:P(AB)?P(B/A)P(A) 更一般地,对事件A1,A2,?An,若P(A1A2?An-1)>0,则有 P(A1A2?An)?P(A1)P(A2|A1)P(A3|A1A2)??P(An|A1A2?An?1)。 ①两个事件的独立性 设事件A、B满足P(AB)?P(A)P(B),则称事件A、B是相互独立的。 若事件A、B相互独立,且P(A)?0,则有 P(B|A)?P(AB)P(A)P(B)??P(B)P(A)P(A) (14)独立性 若事件A、B相互独立,则A与B、A与B、A与B也都相互独立。 必然事件?和不可能事件?与任何事件都相互独立。?与任何事件都互斥。 ②多个事件的独立性 设ABC是三个事件, 如果满足两两独立的条件,P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A); 并且同时满足P(ABC)=P(A)P(B)P(C) 那么A、B、C相互独立。 对于n个事件类似。 若事件A1,A2,?,An(n?2)相互独立,则其中任意k(2?k?n)个事件也相互独立. 若n个事件A1,A2,?,An(n?2)相互独立,则将A1,A2,?,An中任意多个事件换成它们的对立事件,所得的n个事件仍相互独立 . 设事件B1,B2,?,Bn满足 (15)全概公式 1°B1,B2,?,Bn两两互不相容,P(Bi)?0(i?1,2,?,n), 2°n?Bi?1i?S , 则有P(A)?P(B1)P(A|B1)?P(B2)P(A|B2)???P(Bn)P(A|Bn)。 设事件B1,B2,?,Bn及A满足 1° B1,B2,?,Bn两两互不相容,P(Bi)>0,i?1,2,?,n, 2° (16)贝叶斯公式 nA??Bii?1,P(A)?0, 则 P(Bi/A)?P(ABi)P(A)?P(Bi)P(A/Bi)?P(B)P(A/B)jjj?1n, i=1,2,?n。 此公式即为贝叶斯公式。 P(Bi),(i?1,2,?,n),通常叫先验概率。P(Bi/A),(i=1,2,?,n),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。 我们作了n次试验,且满足 ? 每次试验只有两种可能结果,A发生或A不发生; ? n次试验是重复进行的,即A发生的概率每次均一样; ? 每次试验是独立的,即每次试验A发生与否与其他次试验A发生与否是互不影响的。 这种试验称为伯努利概型,或称为n重伯努利试验。 用p表示每次试验A发生的概率,则A发生的概率为1?p?q,用Pn(k)表示n重伯努利试验中A出现k(0?k?n)次的概率, (17)伯努利概型 Pn(k)?Cnpkqn?kk,k?0,1,2,?,n。

第二章 随机变量及其分布

(1)离散型随机变量的分布律 设离散型随机变量X的可能取值为Xk(k=1,2,?)且取各个值的概率,即事件(X=Xk)的概率为 P(X=xk)=pk,k=1,2,?, 则称上式为离散型随机变量X的概率分布或分布律。有时也用分布列的形式: ?xX~?1?p1x2?xn???p2?pn?? Xx1,x2,?,xk,?|P(X?xk)p1,p2,?,pk,? ?pk?pk?0k?1,2,?k?1显然分布律应满足下列条件:(1),, (2)?1。 (2)连续型随机变量的分布密度 设F(x)是随机变量X的分布函数,若存在非负函数f(x),对任意实数x,有 F(x)??f(x)dx??x, 则称X为连续型随机变量。f(x)称为X的概率密度函数或密度函数,简称概率密度。 密度函数具有下面4个性质: 1° f(x)?0。 2° ?????f(x)dx?1。 xx13° 对于任意实数x1,x2(x1?x2),P{x1?X?x2}= F(x2)?F(x1)??2f(x)dx (3)离散与连续型随机变量的关系 (4)分布函数 4° 若f(x)在x处连续,则有F'(x)?f(x) P(X?x)?P(x?X?x?dx)?f(x)dx 积分元f(x)dx在连续型随机变量理论中所起的作用与P(X?xk)?pk在离散型随机变量理论中所起的作用相类似。 设X为随机变量,x是任意实数,则函数 F(x)?P(X?x) 称为随机变量X的分布函数,本质上是一个累积函数。 P(a?X?b)?F(b)?F(a) 可以得到X落入区间(a,b]的概率。分布函数F(x)表示随机变量落入区间(– ∞,x]内的概率。 分布函数具有如下性质: 1° 0?F(x)?1, ???x???; 2° F(x)是单调不减的函数,即x1?x2时,有 F(x1)?F(x2); 3° F(??)?limF(x)?0, F(??)?limF(x)?1; x???x???4° F(x?0)?F(x),即F(x)是右连续的; 5° P(X?x)?F(x)?F(x?0)。 对于离散型随机变量,F(x)?xk?x?pk;对于连续型随机变量,F(x)??? ?f(x)dx 。x

(5)八大分布 0-1分布 二项分布 P(X=1)=p, P(X=0)=q 在n重贝努里试验中,设事件A发生的概率为p。事件A发生的次数是随机变量,设为X,则X可能取值为0,1,2,?,n。 kkn?kP(X?k)?Pn(k)?Cnpq,其中q?1?p,0?p?1,k?0,1,2,?,n, 则称随机变量X服从参数为n,p的二项分布。记为X~B(n,p)。 当n?1时,P(X?k)?pqk1?k,k?0.1,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。 泊松分布 设随机变量X的分布律为P(X?k)??kk!e??,??0,k?0,1,2? 则称随机变量X服从参数为?的泊松分布,记为X~?(?)或( P?)泊松分布为二项分布的极限分布(np=λ,n→∞)。 超几何分布 kn?kk?0,1,2?,lCM?CN?M P(X?k)?,nl?min(M,n)CN随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。 几何分布 P(X?k)?qk?1p,k?1,2,3,?,其中p≥0,q=1-p。 随机变量X服从参数为p的几何分布,记为G(p)。 均匀分布 设随机变量X的值只落在[a,b]内,其密度函数f(x)在[a,b]上为常数 1,即 b?a?1a≤x≤b ,?f(x)??b?a 其他, ??0,则称随机变量X在[a,b]上服从均匀分布,记为X~U(a,b)。 分布函数为 0, xb。 当a≤x1

(1)联合分布函数 设(X,Y)为二维随机变量,对于任意实数x,y,二元函数 F(x,y)?P{X?x,Y?y} 称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。 分布函数是一个以全平面为其定义域,以事件{(?1,?2)|???X(?1)?x,???Y(?2)?y}的概率为函数值的一个实值函数。分布函数F(x,y)具有以下的基本性质: (1)0?F(x,y)?1; (2)F(x,y)分别对x和y是非减的,即 当x2>x1时,有F(x2,y)≥F(x1,y);当y2>y1时,有F(x,y2) ≥F(x,y1); (3)F(x,y)分别对x和y是右连续的,即 F(x,y)?F(x?0,y),F(x,y)?F(x,y?0); (4)F(??,??)?F(??,y)?F(x,??)?0,F(??,??)?1. (5)对于x1?x2,y1?y2, F(x2,y2)?F(x2,y1)?F(x1,y2)?F(x1,y1)?0.

(2)联合分布 离散型 如果二维随机向量?(X,Y)的所有可能取值为至多可列个有序对(x,y),则称?为离散型随机量。 设?=(X,Y)的所有可能取值为(xi,yj)(i,j?1,2,?),且事件{?=(xi,yj)}的概率为pij,,称 P{(X,Y)?(xi,yj)}?pij(i,j?1,2,?) 为?=(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示: Y X y1 p11 p21 y2 p12 p22 ? ? ? ? yj p1j p2j ? ? ? x1 x2 ? xi ? pi1 ? ? pij ? ? ? ? ? ? ? 这里pij具有下面两个性质: (1)pij≥0(i,j=1,2,?); (2)连续型 ??ijpij?1. 对于二维随机变量(X,Y)的分布函数F(X,Y),如果存在非负可积函数f(x,y)使对任意x,y有 yxF(x,y)???????f(u,v)dudv 则称(X,Y)为二维连续型随机变量;并称f(x,y)为(X,Y)的概率密度或称为X和Y的联合概率密度。 概率密度f(x,y)具有下面两个性质: (1) f(x,y)≥0; (2) ??????????f(x,y)dxdy?1. (3)P{(X,Y)?G}???f(x,y)dxdy, G(4)?F(x,y)?f(x,y) ?x?y(2)二维随机变量的本质 (4)离散型与连续型的关系 ?(X?x,Y?y)??(X?x?Y?y) P(X?x,Y?y)?P(x?X?x?dx,y?Y?y?dy)?f(x,y)dxdy X的边缘分布为Pi??P(X?xi)??(5)边缘分布 离散型 ?jijpij(i,j?1,2,?); 分布函数FX(x)?F(x,?)?xi?xj?1??p, Y的边缘分布为P?j?P(Y?yj)???iijpij(i,j?1,2,?)。 分布函数FY(y)?F(?,y)?连续型 yj?yi?1??p. X的边缘分布函数FX(x)?F(x,?)?分布密度为fX(x)??[???x???f(x,y)dy]dx, ?????? f(x,y)dy;Y的边缘分布函数FY(y)?F(?,y)?分布密度为fY(y)?(6)条件分布 离散型 ???y??[?????f(x,y)dx]dy, ??f(x,y)dx. 在已知X=xi的条件下,Y取值的条件分布为 P(Y?yj|X?xi)?pijpi? ;在已知Y=yj的条件下,X取值的条件分布为 P(X?xi|Y?yj)?pijp?j, 连续型 在已知Y=y的条件下,X的条件分布密度为f(x|y)?f(x,y); fY(y)分布函数FXY(xy)???x??fXY(xy)dx 在已知X=x的条件下,Y的条件分布密度为f(y|x)?f(x,y) fX(x)分布函数FYX(yx)? y??fYX(yx)dy

(7)独立性 一般型 离散型 连续型 二维正态分布 F(X,Y)=FX(x)FY(y) pij?pi?p?j 有零不独立 f(x,y)=fX(x)fY(y) 直接判断,充要条件:①可分离变量②正概率密度区间为矩形 f(x,y)?12??1?21??2?e??x???22?(x??)(y??)?y??1?122???????2??????2(1??)??1?122?1????2????, 独立??=0?不相关 (???xy) 随机变量的函数 (8)二维均匀分布 若X1,X2,?Xm,Xm+1,?Xn相互独立, h,g为连续函数,则: h(X1,X2,?Xm)和g(Xm+1,?Xn)相互独立。 特例:若X与Y独立,则:h(X)和g(Y)独立。 ?1?S?Df(x,y)???0,??设随机向量(X,Y)的分布密度函数为 (x,y)?D 其他其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)~U(D)。 (9)二维正态分布 设随机向量(X,Y)的分布密度函数为 ??x???22?(x??)(y??)?y??1?122????????2??????2(1??)??1?122?12?f(x,y)?12??1?21??2e???????, 其中?1,?2,?1?0,?2?0,|?|?1是5个参数,则称(X,Y)服从二维正态分布, 记为(X,Y)~N(?1,?2,?1,?2,?). 由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即X~N(?1,?1),Y~N(?2,?2). 但是若X~N(?1,?1),Y~N(?2,?2),(X,Y)未必是二维正态分布。 222222(10)函数分布 离散型P{X?xi,Y?yj}?pij,i,j?1,2,?,随机变量函数Z?g(X,Y)的分布律为 P{Z?zk}?P{g(X,Y)?zk}?zk?g(xiyj)?pij, k?1,2,?. 连续型Z=?(X,Y),FZ(z)?P{Z?z}?P{?(X,Y)?z}??(x,y)?z??f(x,y)dxdy 化成二次积分,做变换u=?(x ,y),交换积分次序,对变上限积分求导即得fZ(z) Z=X+Y 根据定义计算:FZ(z)?P(Z?z)?P(X?Y?z) 对于连续型,fZ?z?=???????f(x,z?x)dx????f(z?y,y)dy 一般地,对于Z=aX+bY 1z?ax1z?byfZ?z?=f(x,)dx?f(,y)dy ??|b|??b|a|??a两个独立的正态分布的和仍为正态分布(?1??2,?1??2)。 n个相互独立的正态分布的线性组合,仍服从正态分布。 22???????Ci?i, ?2??Ci2?i2 iiZ=max,min(X1,X2,?Xn) 若X1,X2?Xn相互独立,其分布函数分别为Fx1(x),Fx2(x)?Fxn(x),则Z=max,min(X1,X2,?Xn)的分布函数为: Fmax(x)?Fx1(x)?Fx2(x)?Fxn(x) Fmin(x)?1?[1?Fx1(x)]?[1?Fx2(x)]?[1?Fxn(x)] Z=Y/X Z=XY ??fYX(z)?|x|f(x,xz)dx????fXY(z)?1zf(x,)dx|x|x??

第四章 随机变量的数字特征

(1)一维随机变量的数字特征 期望 期望就是平均值 离散型 设X是离散型随机变量,其分布律为P(X?xk)=pk,k=1,2,?,n, 连续型 设X是连续型随机变量,其概率密度为f(x), ??E(X)?E(X)??xkpk k?1n???xf(x)dx (要求绝对收敛) (要求绝对收敛) 函数的期望 Y=g(X) Y=g(X) nE(Y)??g(xk)pk k?1??E(Y)??g(x)f(x)dx ??方差 D(X)= 2E{[X-E(X)]} 标准差 ?(X)?D(X), D(X)??[xk?E(X)]pk 2kD(X)??[x?E(X)]2f(x)dx ????D(X)?E(X2)?[E(X)]2 标准化变量:X?*X??? 期望的性质 (1)E(C)=C (2)E(CX)=CE(X) (3)E(X+Y)=E(X)+E(Y),E(?CXii?1ni)??CiE(Xi) i?1n(4)E(XY)=E(X)E(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 方差的性质 (1) D(C)=0;E(C)=C 2(2) D(aX)=aD(X); E(aX)=aE(X) 2(3) D(aX+b)= aD(X); E(aX+b)=aE(X)+b 22(4) D(X)=E(X)-E(X) (5) D(X±Y)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 D(X±Y)=D(X)+D(Y)±2E[(X-E(X))(Y-E(Y))],无条件成立。 而E(X+Y)=E(X)+E(Y),无条件成立。 (6) D(X)=0?X以概率1取常数E(X),即P{X=E(X)}=1 矩 ①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即 νk=E(X)= k①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即 νk=E(X)=k?xikipi, ?????xkf(x)dx, k=1,2, ?. ②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为?k,即?k?E(X?E(X))= k k=1,2, ?. ②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为?k,即?k?E(X?E(X))k =?(xi?E(X))kpik=1,2, ? i?????(x?E(X))kf(x)dx, 2k=1,2, ?. 切比雪夫不等式 设随机变量X具有数学期望E(X)=μ,方差D(X)=σ,则对于任意正数ε,有下列切比雪夫不等式 ?2P(X????)?2 ?切比雪夫不等式给出了在未知X的分布的情况下,对概率 P(X????) 的一种估计,它在理论上有重要意义。 (4)常见分布的期望和方差 0-1分布B(1,p) 二项分布期望 方差 p p(1?p) np(1?p) B(n,p) 泊松分布P(?) 几何分布G(p) 超几何分布 H(n,M,N) 均匀分布U(a,b) 指数分布e(?) 正态分布N(?,?2) np ? 1 p? 1?p 2pnM?M??N?n? ?1????N?N??N?1?nM Na?b 2(b?a)2 121 ?1?2 ? n 0 ?2 2n ?2分布 t分布 n(n>2) n?2(5)二维随机变量的数字特征 期望 E(X)??xipi? i?1n??E(X)??????xfX(x)dx E(Y)??yjp?j j?1nE(Y)????yfY(y)dy 函数的期望 E[G(X,Y)]= E[G(X,Y)]= ??G(x,yiijj)pij ????-?-???G(x,y)f(x,y)dxdy ????方差 D(X)??[xi?E(X)]2pi? iD(X)??[x?E(X)]2fX(x)dx D(Y)??[xj?E(Y)]2p?j jD(Y)??[y?E(Y)]2fY(y)dy ????协方差 对于随机变量X与Y,称它们的二阶混合中心矩?11为X与Y的协方差或相关矩,记为?XY或cov(X,Y),即 ?XY??11?E[(X?E(X))(Y?E(Y))]. 与记号?XY相对应,X与Y的方差D(X)与D(Y)也可分别记为?XX与?YY。 相关系数 对于随机变量X与Y,如果D(X)>0, D(Y)>0,则称 ?XYD(X)D(Y) 为X与Y的相关系数,记作?XY(有时可简记为?)。 |?|≤1,当|?|=1时,称X与Y完全相关:P{X?aY?b}?1 完全相关??正相关,当??1时(a?0),?负相关,当???1时(a?0), 而当??0时,称X与Y不相关。 以下五个命题是等价的: ①?XY?0; ②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y).

协方差矩阵 ??XX????YX?XY?YY??? ?kl混合矩 对于随机变量X与Y,如果有E(XY)存在,则称之为X与Y的k+l阶混合原点矩,记为?kl;k+l阶混合中心矩记为: ukl?E[(X?E(X))k(Y?E(Y))l]. (6)协方差的性质 (7)独立和不相关 (i) (ii) (iii) (iv) (v) (i) (ii) cov (X, Y)=cov (Y, X);cov(X,X)=D(X); D(X?Y)=D(X)+D(Y)?2cov(X,Y) cov(aX,bY)=ab cov(X,Y); cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y); cov(X,Y)=E(XY)-E(X)E(Y). 若随机变量X与Y相互独立,则?XY?0;反之不真。 2若(X,Y)~N(?1,?2,?12,?2, ,?)则X与Y相互独立的充要条件是X和Y不相关。 第五章 大数定律和中心极限定理

(1)大数定律 X?? 切比雪夫大数定律 设随机变量X1,X2,?相互独立,均具有有限方差,且被同一常数C所界:D(Xi)

第六章 样本及抽样分布

(1)数理统计的基本概念 总体 个体 容量 样本 试验全部可能的观察值。 每一个有可能的观察值。 总体所包含的个体的个数。 设X是具有分布函数F的随机变量,若X1,X2,?,Xn是具有同一分布函数F、相互独立的随机变量,则称X1,X2,?,Xn为从分布函数F(或总体F、或总体X)得到的容量为n的简单随机样本,简称样本.它们的观察值x1,x2,?,xn称为样本值,又称为X的n个独立的观察值.若X1,X2,?,Xn为F的一个样本,则X1,X2,?,Xn的联合分布函数为F*(x1,x2,?,xn)??F(xi). i?1n又若X具有概率密度f,则X1,X2,?,Xn的联合概率密度为 f*(x1,x2,?,xn)??f(xi). i?1n统计量 设X1,X2,?,Xn是来自总体X的一个样本,g(X1,X2,?,Xn)是设x1,x2,?,xn是相应于样本X1,X2,?,Xn 的样本值,则称g(x1,x2,?,xn)是g(X1,X2,?,Xn)的观察值.不含未知参数, 则称g(X1,X2,?,Xn)是一个统计量.X1,X2,?,Xn的函数,若g中常见统计量及其性质 样本均值 1nX??Xi. ni?12样本方差 n21n122S?(X?X)?(X?nX). ?i?in?1i?1n?1i?1样本标准差 1nS?(Xi?X)2. ?n?1i?1 样本k阶原点矩 1nkAk??Xi,k?1,2,?. ni?11nk样本k阶中心矩 Bk??(Xi?X),k?2,3,?. ni?1P若总体X的k阶矩E(Xk)记成?k存在,则当n??时,Ak????k,k?1,2,?Pg(A1,A2,?,Ak)???g(?1,?2,?,?k), (3)正态总体下的三大分布 ?2分布 设n个随机变量X1,X2,?,Xn相互独立,且服从标准正态分布,可以证明它们的平方和??2?Xi?1n2i ny?1??122ue?nn???的分布密度为f(y)??22????2????0,u?0, u?0.222???我们称随机变量W服从自由度为n的分布,记为~(n),其中?n????1?????x2e?xdx.?2?0 所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个n重要参数。 可加性: 设?i??(ni),则Z?期望和方差: 22??i?1k2i~?2(n1?n2???nk). E(?2)?n,D(?2)?2n 分位点: 对于给定的正数?,0???1,称满足条件P{????(n)}??22?2??(n)f(y)dy??的点??(n)为?(n)分布的上?分位点.22 t分布 2X~N(0,1),Y~?(n), 设X,Y是两个相互独立的随机变量,且T?可以证明函数XY/n的概率密度为 ?n?1?n?1????t2??22? (???t???). h(t)??1???n??n?n??????2?我们称随机变量T服从自由度为n的t分布,记为T~t(n)。 t22limh(t)?n??1e2π?,n足够大时,t?N(0,1) 分位点: 对于给定的?,0???1,称满足条件P{t?t?(n)}??的点t?(n)为t(n)分布的上?分位点.?t?(n)h(t)dt??t1??(n)??t?(n)F分布 2 2设U~?(n1),V~?(n2),且X与Y独立,可以证明F?密度函数为 U/n1的概率V/n2??n1?n2?n1???2??n?2n1?1?n?1??y2?1?1???(y)???n1??n2??n2??n2????????2??2??0,y?0??y???n1?n22,y?0 我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为F~F(n1, n2). 若F~F(n1,n2),则分位点: 1~F(n2,n1). F对于给定的?,0???1,称满足条件P{F?F?(n1,n2)}????F?(n1,n2)?(y)dy??的点F?(n1,n2)为F(n1,n2)分布的上?分位点.1F?(n2,n1)。 F1??(n1,n2)?

(4)正态总体下分布的性质 定理一:设X1,X2,?,Xn是来自正态总体N(?,?2)的样本, X 是样本均值 ,则有X~N(?,?2/n)。定理二:设X1,X2,?,Xn是总体N(?,?2)的样本,X,S2分别是样本均值和样本方差,则有(1)(n?1)S2?2~?2(n?1);(2)X与S2独立.定理三:设X1,X2,?,Xn是总体N(?,?2)的本方差,则有X??~t(n?1).S/n定理四:设X1,X2,?,Xn1与Y1,Y2,?,Yn2分别是具有相同方差的两正态总体1n11N(?1,?),N(?2,?)的样本,且这两个样本互相独立,设X??Xi,Y?n1i?1n22221样本,X,S2分别是样本均值和样?Yi?1n2i1n11n222分别是这两个样本的均值,S?(Xi?X),S2?(Yi?Y)2分别是这??n1?1i?1n2?1i?1两个样本的方差,则有2S12/S2(1)22~F(n1?1,n2?1);?1/?22(2)当 ?12??2??2 时,(X?Y)?(?1??2)Sw2w11?n1n2~t(n1?n2?2),2(n1?1)S12?(n2?1)S22其中S?,Sw?Sw.n1?n2?2

第七章 参数估计

(1)矩估点估计 计 设X为连续型随机变量,其概率密度为f(x;?1,?2,?,?k),或X为离散型随机变量,其分布律为P{X?x}?p(x;?1,?2,?,?k),其中?1,?2,?,?k为待估参数,若X1,X2,?,Xn为来自X的样本,假设总体X的前k阶矩存在,且均为?1,?2,?,?k的函数,即???E(Xl)???xlf(x;?,?,?,?)d(xX为连续型)12k????l?ll??E(X)?xp(x;?1,?2,?,?k)(X为离散型)?l?x?RX?1nl其中RX是x可能取值的范围,l?1,2,?,k样本矩Al??Xini?1?,??,?,??令?l?Al,l?1,2,?,k.解出其中?1,?2,?,?k.用方程组的解?12k分别作为?1,?2,?,?k的估计量,这个估计量称为矩估计量. 最大似然估计 当总体X为连续型随机变量时,设其分布密度为f(x;?1,?2,?,?m),其中?1,?2,?,?m为未知参数。又设x1,x2,?,xn为总体的一个样本,称 L(x1,x2,?,xn;?1,?2,?,?m)??f(xi;?1,?2,?,?m) i?1n为样本的似然函数,简记为Ln. 当总体X为离型随机变量时,设其分布律为P{X?x}?p(x;?1,?2,?,?m),则称 L(x1,x2,?,xn;?1,?2,?,?m)??p(xi;?1,?2,?,?m) i?1n为样本的似然函数。 若似然函数L(x1,x2,?,xn;?1,?2,?,?m)在?1,?2,?,?m处取到最大???2???值,则称?1,?,?,?m分别为?1,?2,?,?m的最大似然估计值,相应的统计量称为最大似然估计量。 ?lnLn??i??0,i?1,2,?,m ?i??i??)为g(?)的极大若?为?的极大似然估计,g(x)具有单值反函数,则g(?似然估计。 (2)无偏估计性 量的评选标准 有效性 设???(x1,x2,?,xn)为未知参数?的估计量。若E (?)=?,则称 ?为?????的无偏估计量。 E(X)=E(X), E(S)=D(X) 设?1??1(x1,x,2,?,xn)和?2??2(x1,x,2,?,xn)是未知参数?的两个无偏估计量。若D(?1)?D(?2),则称?1比?2有效。 ??2??????一致(相合)性 ????(X,X,?,X)为参数?的估计量,若对于任意???, 当n??时,若?12n?(X,X,?,X)依概率收敛于?, 则称??为?的相合估计量.?12n即对于任意的正数,都有limP(|???|??)?0,n??? ?)?0(n??),则?为?的一致估计。若?为?的无偏估计,且D(?只要总体的E?X?和D?X?存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。(3)置信区间区间估计 和置信度 设总体X的分布函数F(x;?)含有一个未知参数?, 对于给定值? (0???1)?,Xn)满足P{?(X1,X2,?,Xn)????(X1,X2,?,Xn)}?1??,则称随机区间 (?, ?)是?的置信度为1??的置信区间, ? 和 ?分别称为置信度为1??的双侧置信区间的置信下限和置信上限, 1??为置信度.若由样本X1,X2,?,Xn确定的两个统计量?=?(X1,X2,?,Xn)和?=?(X1,X2,?? 单正已知方差态总估计?2,体的期望均值? 和方差的区间估计 未知方差估计?2,均值? (i)选择样本函数 u?X??~N(0,1). ?/n?x???z?/2??1??. ??0/n?(ii) 查表找分位数 P??z?/2????(iii)导出置信区间 ?X?????z?/2? n?(i)选择样本函数 X??~t(n?1). S/n(ii)查表找分位数 P??t?/2(n?1)?????t?/2(n?1)??1??. S/n?X??(iii)导出置信区间 ?X???S?t?/2(n?1)?. n?未知均值?,估计方差? 2(i)选择样本函数 (n?1)S2?2~?2(n?1). ?2?(n?1)S22??(n?1)(ii)查表找分位数 P??1??/2(n?1)???1??. ?/22????(n?1)S2(n?1)S2?,2(iii)导出?的置信区间 ?2?. ?(n?1)?(n?1)1??/2??/2?2已知均值?,估计方差? 2(i)选择样本函数 1?2?(Xi?1n2??)~?(n). i1n?2?2(ii)查表找分位数 P??1??/2(n)?2?(Xi??)???/2(n)??1??. ?i?1???n??(Xi??)2,(iii)导出?的置信区间 ?i?12???/2(n)???(X???)i?i?1?. 2?1??/2(n)???n 两个正态总体的期望和方差的区间估计 两个总体均值差 ??12?22?(1)?和?2均为已知,?X?Y?z?/2??. ?n1n2???212?1??2 的置信区间估计???12??22?X~N??1,?,Y~N??2,?,nn?1??2???X?Y????1??2?~N0,1,?12?22?X?Y~N??1??2,?,或 ???22nn???12?1?2n1n2 (2)?12和?22均为未知,n1和n2都很大?S12S22???X?Y?z?/2?.?n1n2??? X??1Y??2~t(n1?1)~N(0,1),~t(n2?1)~N(0,1).S1/n1S2/n2??X?Y????1??2?~N0,1,S12S22?X?Y~N??1??2,?,或 ???22nnSS?12?1?2n1n2 (3)?12??22??2, 但 ?2 为未知, ?11?X?Y?t(n?n?2)S??.??/212w??n1n2??(n1?1)S12?(n2?1)S222Sw?,Sw?Sw2n1?n2?2(X?Y)?(?1??2)Sw11?n1n2~t(n1?n2?2), 两个总体方差比 ? 的?置信区间2122 ?S12?S1211 ?1, ?2 未知?2,2?.SF(n?1,n?1)SF(n?1,n?1)221??/212?2?/21?S12?12~F(n1?1,n2?1), S22?22 0-1分布的区间估计 ?Xi?1ni?np?np(1?p)nX?np近似地服从 N(0,1) 分布 np(1?p)??nX?np??P??z?/2??z?/2??1??, np(1?p)????22??b?b2?4ac?b?b2?4ac?a?n?z?/2,c?nX,??,2??b??(2nX?z?2a2a/2)?? 或用(4)单侧 置信区间 X?p近似服从N(0,1)分布 Sn? ????,X??SS???t?(n?1)?,?X?t?(n?1),??? nn????2 ?(n?1)S2??0,2?. ?(n?1)1????

第八章 假设检验

基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。 为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。与H0相对的假设称为备择假设,用H1表示。 这里所说的小概率事件就是事件{K?R?},其概率就是检验水平α,通常我们取α=0.05,有时也取0.01或0.10。 基本步骤 假设检验的基本步骤如下: (i) 提出零假设H0; (ii) 选择统计量K; (iii) 对于检验水平α查表找分位数λ; (iv) ?由样本值x1,x2,?,xn计算统计量之值K; ??将K与?进行比较,作出判断:当|K|??(或K??)时否定H0,否则认为H0相容。 两类错误 第一类错误 当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记?为犯此类错误的概率,即 P{否定H0|H0为真}=?; 此处的α恰好为检验水平。 当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记?为犯此类错误的概率,即P{接受H0|H1为真}=?。 两类错误的关系 人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时,?变小,则?变大;相反地,?变小,则?变大。取定?要想使?变小,则必须增加样本容量。 在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如0.01,甚至0.001。反之,则应把α取得大些。 第二类错误 原假设H0 2w检验统计量 备择假设H1 拒绝域 1 2 ???0???0???0(?2已知)???0???0???0(?2未知)?1??2???1??2???1??2??2(?12,?2已知)Z?X??0?/n???0???0???0???0???0???0z?z?z??z?z?z?/2t?t?(n?1)t??t?(n?1)t?t?/2(n?1)t?X??0S/n 3 Z?X?Y???21n1??22n2???0?????0?????0?????0?????0?????0??z?z?z??z?z?z?/2t?t?(n1?n2?2)t??t?(n1?n2?2)t?t?/2(n1?n2?1) 4 ?1??2???1??2???1??2??22(?1??2??2未知)t?X?Y??11Sw?n1n22(n?1)S12?(n2?2)S2S?1n1?n2?2 5 ???0?2??02?2??02(?未知) (n?1)S2?2? ?02 ????2???2??2202020 F?S12S222?2???(n?1)?2??12??(n?1)2?2???/2(n?1)或22???1??/2(n?1) 6 2?12??22?12??22?12??2(?1,?2未知) ?12??22?12??22?12??22 F?FF?F?(n1?1,n2?1)1??(n1?1,n2?1)F?F?/2(n1?1,n2?1)或F?F1??/2(n1?1,n2?1) 7 1?D?0?D?0?D?0(成对数据)n t?D?0SD/n ?D?0?D?0?D?0 t?t?(n?1)t??t?(n?1)t?t?/2(n?1) 25 中 ?2?(Xi??)~?(n).

i?1(?已知)牛顿二项公式:(a?b)?n?Cabini?0??nin?i

积分公式:e?xdx?? ,

?2??02?0e?x22dx?? 2二项分布最大值:(n+1)p为整数(n+1)p=或(n+1)p-1处 非整数最接近(n+1)p的整数处 Γ函数:

Γ(x+1)=xΓ(x),Γ⑴=1,Γ(1/2)=√π,对正整数n,有Γ(n+1)=n!,Γ(1-x)Γ(x)=π/sin(πx)

本文来源:https://www.bwwdw.com/article/mth5.html

Top