假设检验

更新时间:2023-10-14 01:41:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第五章假设检验

本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2.熟练掌握总体均值与总体成数指标的各种检验方法;包括:z检验、t检验和p-值检验;4.掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验;5.能利用Excel进行假设检验。

第一节假设检验概述

一、假设检验的基本概念

假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。本章分别讨论这两类检验方法。 进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理”,对假设的正确性做出判断。这种思维方法与数学里的“反证法”很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。其实,我们在日常生活中,不仅不肯接受概率为0的事件,而且对小概率事件,也持否定态度。比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。

所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。这种事件称为“实际不可能事件”。

小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平α(0<α<1)作为小概率的界限,α的取值与实际问题的性质有关。所以,统计检验又称显著性检验。

下面通过一个具体例子说明假设检验是怎样进行的。

【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?

上述例子中,消费者协会实际要进行的是一项统计检验工作,检验总体平均容量是否等

?于包装上注明的250毫升。即,检验总体平均=250是否成立。这就是一个原假设(null hypothesis),通常用

H

0

H

0

表示,即:

H:

?=250

与原假设对立的是备选假设(alternative hypothesis)1,备选假设是在原假设被否定时另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出现的结论作为备选假设。上例中可能的备选假设有三种:

第一种:如果消费者协会希望知道的是,该品牌饮料的平均容量是否为标明的250毫升,则

H1:

?≠250

H1第二种:如果消费协会希望知道该品牌饮料的平均容量是否少于标明的250毫升,则?<250

第三种:如果消费者协会希望知道该品牌饮料的平均容量是否大于标明的250毫升,则

H1:

?>250

由于备选假设不同,可将假设检验分为双侧(边、尾)检验(two tailed test),和单侧(边、尾)检验(one tailed test)。对此,我们在后面将进一步说明。

原假设与备选假设确定之后,我们要构造一个统计量来决定是“接受原假设,拒绝备选假设”,还是“拒绝原假设,接受备选假设”。对不同的问题,要选择不同的检验统计量。检验统计量确定后,就要利用该统计的分布以及由实际问题中所确定的显著性水平,来进一步确定检验统计量拒绝原假设的取值范围,即拒绝域。在给定的显著性水平α下,检验统计量的可能取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过显著性水平α的区域,是原假设的拒绝区域;大概率区域是概率为1-α的区域,是原假设的接受区域。如果样本统计量落入拒绝域,我们就拒绝原假设,接受备选假设,认为样本数据支持备选假设的结论;如果样本统计量落入接受区域,我们就接受原假设,认为没有充分证据证明备选假设结论为真。请注意,我们这里使用的判断语气比较委婉,原因是:拒绝域是小概率区域,按小概率原理应该拒绝原假设,但是,小概率事件不是完全不可能事件,还是有可能发生的;接受区域是大概率区域,大概率事件也不是必然事件。无论是接受原假设还是拒绝原假设,都有产生判断失误的可能。因此,不宜将统计检验的结论过于绝对化。 二、两种类型的错误

统计假设检验是通过比较检验统计量的样本数值,作出决策。统计量是随机变量,据之所作的判断不可能保证百分之百的正确。一般来说,决策结果存在以下四种情形:

原假设是真实的,判断结论是接受原假设,这是一种正确的判断; 原假设是不真实的,判断结论是拒绝原假设,这也是种正确的判断;

原假设是真实的,判断结论是拒绝原假设,这是一种产生“弃真错误”的判断;

原假设是不真实的,判断结论是接受原假设,这又是一种产生“取伪错误”的判断。 以上四种判断可归纳为下列表格形式:

表5-1 统计决策表

HH0接受H0 拒绝H0 真实 不真实 判断正确 取伪错误(β) 弃真错误(α) 判断正确 0以上的弃真错误也称作假设检验的“第一类错误”;取伪错误也称作假设检验的“第二类错误”。无论是第一类错误还是第二类错误,都是检验结论失真的表现,都是应尽可能地加以避免的情形,如果不能完全避免,也应该对其发生的概率加以控制。

第一类错误产生的原因是:在原假设为真的情况下,检验统计量不巧刚好落入小概率的拒绝区域。因此,犯第一类错误的概率大小就等于显著性水平的大小,即等于α。我们可以通过控制显著性水平大小的方式,来控制犯第一类错误的可能性大小。α定的越小,犯第一类错误的可能性就越小,例如α=0.05,表示犯第一类错误的可能性为5%,100次判断中,产生弃真性错误的次数是5次;进一步降低显著性水平,取α=0.01,这时犯第一类错误的概率下降为1%。所以统计学上,又称第一类错误为α错误。

第二类错误是“以假为真”的错误,即把不正确的原假设,当做正确的而将它接受了的错误。犯第二类错误大小的概率记为β,因此,统计学上称第二类错误为β错误。犯第二类错误的概率与犯第一类错误的概率是密切相关的,在样本一定条件下,α小,β就增大;α

大,β就减小。为了同时减小α和β,只有增大样本容量,减小抽样分布的离散性,这样才能达到目的。它们这种关系可通过正态分布的统计检验,图示如下:

p(x)

?0β

α z? ?1图5-1 α与β关系示意图

H

0

【例5-2】按照法律,在证明被告有罪之前应先假定他是无罪的。也就是原假设是

H:

被告无罪;备选假设1:被告有罪。法庭可能犯的第一类错误是:被告无罪但判他有罪;第二类错误是:被告有罪但判他无罪。犯第一类错误的性质是“冤枉了好人”,第二类错误的性质是“放过了坏人”。为了减小“冤枉好人”的概率,应尽可能接受原假设,判被告无罪,这就有可能增大了“放过坏人”的概率;反过来,为了不“放过坏人”,增大拒绝原假设的概率,相应地就又增加了“冤枉好人”的可能性,这就是α与β的关系。当然,这只是在“一定的证据下”的两难选择。如果进一步收集有关的证据,在充分的证据下,就有可能做到既不冤枉好人,又不放过坏人。在现有证据不充分的条件下,法庭控制两类错误概率的实践是:按案件的性质决定首先要控制哪一类错误的概率,如果案件将来对社会危害大,就要控制少犯第二类错误的概率,免得放过的坏人继续危害社会;如果案件对社会没有什么大的危害,不妨“放他一马”,免得冤枉了好人,影响当事人“一生的前程”。

三、检验功效

检验效果好与坏,与犯两类错误的概率都有关。一个有效的检验首先是犯第一类错误的概率α不能太大,否则的话,就经常产生弃真现象;另外,β错误就是取伪的错误,在犯第一类错误概率得到控制的条件下,犯取伪错误的概率也要尽可能地小,或者说,不取伪的概率1-β应尽可能增大。1-β越大,意味着当原假设不真实时,检验判断出原假设不真实的概率越大,检验的判别能力就越好;1-β越小,意味着当原假设不真实时,检验结论判断出原假设不真实的概率越小,检验的判别能力就越差。可见1-β是反映统计检验判别能力大小的重要标志,我们称之为检验功效或检验力。

前面分析说明,第一类错误和第二类错误是一对矛盾体,在其他条件不变时,减小犯第一类错误的可能性,势必增加犯第二类错误的可能性;增大第一类错误的可能性,又能减小犯第二类错误的可能性。可见α的大小,影响到β的大小,进而影响到1-β的大小。犯第一类错误的概率或检验的显著性水平α是影响检验力的一个重要因素。在其他条件不变下,显著性水平α增大,β随之减小,检验功效就增强。可见取α=0.1时比取α=0.01时,检验的功效强,检验力大。

我们在统计检验中,一般都是首先控制犯第一类错误的概率,也就是显著性水平α都尽量取较小的值,尽量避免犯弃真的错误,在其他条件不变时,β就增大,检验的功效就减弱。该如何来调和这一对相互对抗的矛盾呢?惟一的办法就是增大样本容量,因为增加样本容量能够既保证满足较小的α需要,同时又能减小犯第二类错误的概率β,抵消检验功效的衰减。可见样本容量大小是影响检验功效大小的一个重要因素,可通过增大样本容量方法提高检验功效。然而,实际上样本容量n的增加也是有限制的,兼顾α与β很困难,这时,鉴于α风险一般比β风险重要,首先考虑的还是控制α风险。

影响检验功效大小的另一因素是原假设与备选假设间的差异程度。如果这两个假设间的差异是非常明显的,这时原假设不真而取伪的可能性就减小,即β就减小,检验功效就大。否则的话,就较难通过检验把原假设与备选假设区分开来,影响检验功效的提高。

第二节总体参数检验

一、单侧检验与双侧检验

在前面介绍的统计检验程序中,我们看到,通过确定的检验统计量、事先给出的显著性水平,可以找出一个临界值,将统计量的取值范围划分成接受区域与拒绝区域两部分。拒绝区域是检验统计量取值的小概率区域,我们可以将这个小概率区域安排在检验统计量分布的两端,也可以安排在分布的一侧,分别称作双侧检验与单侧检验。单侧检验又按拒绝域在左侧还是在右侧而分为左侧检验与右侧检验两种。我们通过服从正态分布的检验统计量图示如下:

α α –Z 0 α/2 –Zα 0

(b)左侧检验(c)右侧检验

αα/2 /2 –Zα2/Z2 –Z/αZ/α/2 2α

–αα –αα/2 /2

(a)双侧检验

0 0 ZαZ α

图5-2 双侧、单侧检验的拒绝域分配

一个统计检验究竟是使用双侧检验还是使用单侧检验,单侧检验时,是使用左侧检验还是使用右侧检验,这取决于备选假设的性质。比如,当总体标准差已知时,我们对正态总体的均值进行检验,使用的检验统计量是:

z?X??0 (5.1)

按备选假设的不同,存在三种情形: (1)(2)(3)

HHH

0

?n:::

???0???0???0,,,

H1H1H1:::

???0???0???0

?0

0

对于第一种情形,备选假设是总体均值不等于一个给定的0,检验统计量取极端值,不论是在极端大的右侧取值,还是在极端小的左侧取值,都有利于拒绝原假设,接受备选假设。因此拒绝原假设的拒绝域被安排在左右两侧,使用的是双侧检验。对于第二种情形,备选假设是总体均值小于一个确定的0,检验统计量越在极端大的右侧取值,越有利于说明总体的均值较大,这对备选假设是不利的。因此,拒绝域不宜安排在右侧,安排到左侧去比

?较合适,使用左侧检验。对于第三种情形,备选假设是总体均值大于一个确定的?0,检验统计量在极端小的左侧取值时,对备选假设是不利的。因此拒绝原假设的拒绝域被安排在左侧,而使用单侧检验中的右侧检验。最后我们可以归纳结论是:用单侧检验还是双侧检验,使用左侧检验还是右侧检验,决定于备选假设中的不等式形式与方向。与“不相等”对应的是双侧检验,与“小于”相对应的是左侧检验,与“大于”相对应的是右侧检验。

二、总体平均数的检验

(一)先考虑总体标准差σ已知的情形

在例5-1中,设按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。程序如下:

第一步:确定原假设与备选假设。

:=250,1:<250

以上的备选假设是总体均值小于250毫升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)。因此使用左侧检验。

第二步:构造出检验统计量。

我们知道,如果总体的标准差已知,则正态总体(正常情况下,生产饮料的容量服从正

0

H?H?态分布)的抽样平均数,也服从正态分布,对它进行标准化变换,可得到:

z?X??0(5.2)

可用z作为检验统计量。

第三步:确定显著性水平,确定拒绝域。

显著水平由实际问题确定,我们这里取α=0.05,使用左侧检验,拒绝域在左边,查标准正态分布表得临界值:-?=-1.645,拒绝域是z<-1.645。

第四步:计算检验统计量的数值。

样本平均数X?248,n=50,代入检验统计量得:

z?X??0248?250450z?n~N?0,1?????3.54??1.645n

第五步:判断。

检验统计量的样本取值落入拒绝域。拒绝原假设,接受备选假设,认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的250毫升,厂商有欺骗行为。

(二)总体标准差未知的情形

我们在区间估计时已知,当总体的标准差或方差未知时可相应地用样本的标准差与方差代替它们。但这时检验统计量不服从标准正态分布了。事实上这时的检验统计量是:

t?X??0sn~t(n?1) (5.3)

式中S是样本标准差,检验统计量服从的是自由度为n-1的t分布。这里用t作为检验总体均值的统计量,称之为t-检验统计量(t-test statistic)。但是,在大样本场合(样本容量n大于30时),t-统计量与标准正态分布统计量近似,通常用z检验代替t检验。

【例5-3】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克,某日随机抽查9包,测得样本平均重量为986克,样本标准差是24克。试问在α=0.05的显著性水平上,能否认为这天自动包装机工作正常?

解:第一步:确定原假设与备选假设。

H

0

?=1000,

H1:

??1000

本文来源:https://www.bwwdw.com/article/2b1f.html

Top