SPSS统计分析1

更新时间:2023-10-02 21:23:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第1章 平均数差异检验 某省重点中学××校长在教职工会议上说道:\为了提高我们学校的升学率,请各位高三的老师多多辛苦,对有希望考上大学的学生重点培养。对于一班、五班和十班这3个重点班要特别关注,这些孩子的智商比较高,可能会出几个清华北大的秧子……\二班年轻的班主任小王嘀咕道:\这么分重点班是不合理的,学生应该一视同仁,谁说重点班的孩子就智商高啊?又没有根据的……\那么重点班的学生和一般学生的平均智商是否有差异呢?要解决这个问题就可以运用平均数差异检验的方法。首先对重点班的学生进行测试,得出其平均智商得分x=109,已知总体高三学生的平均智商x=100,呈正态分布。虽然该中学重点班学生在这一次测试中的平均得分109大于高三学生总体的平均得分100,但并不能就得出该校重点班学生智商较高的结论,因为测试的得分是有一定波动性的,可能再一次用同质的智力测验量表进行测量,重点班学生的平均智商又低于100 。因此,这种差异必须通过假设检验,并达到统计学上的显著才能认为真正存在。 1.1 假设检验原理 假设检验(hypothesis testing)是推论统计中的重要内容,是指先提出一个假设,一般是对总体参数或总体分布形态的假设,然后通过检验样本统计量的差异来推断总体参数之间是不是存在差异。因为在现实调查研究中,往往由于各种限制而无法得到总体的参数。例如要调查汉族和蒙古族7岁儿童的运算能力是否存在差异,不可能对所有汉族和蒙古族7岁儿童进行测试,只能通过合理的抽样,然后对样本进行调查。这样得到的参数就是样本的参数,通过对样本的参数进行检验从而推测汉族7岁儿童总体和蒙古族7岁儿童总体在运算能力上是否有差异。 1.1.1 假设与假设检验 在科学研究中,往往先要根据已有的理论和事实对研究的课题提出一个希望证实的假设。如要研究男性和女性对于网购的态度,社会心理学家可能会假设两性更愿意网购的倾向性是有差异的。在统计学中,假设一般用来指对总体参数所做的假定性说明。 在统计学上有两种假设,一种称为虚无假设(null hypothesis),或叫做零假设,记为H0;一种称为备择假设(alternative hypothesis),或叫做对立假设,记为H1。H1是研究者提出的研究假设。如引子中,研究者的假设是该中学重点班学生的平均智商不同于高三学生总体的平均智商,若假设对该校高三重点班学生进行多次同质的智商测试得出的总平均数为 1,则选择假设H1: 1≠ 0。然而,在统计学中无法直接检验H1 是否成立,因为在逻辑上要证明A≠B,则必须要对A所包含的所有可能和B所包含的所有可能进行检验,而这就像上面所说的无法对总体参数进行测量一样,是无法实现的。但是证伪A=B就相对简单得多,只要找到一个A≠B的例子就可以推翻A=B。

因此,在统计学上,只能对虚无假设H0进行直接的检验。假设检验的任务就是先假设H0是真的,然后以此为前提,如果有不合理的现象出现则说明假设是错误的,即H0为真这一假设是不成立的,要被拒绝。如果H0为假,就要拒绝H0并接受H1,则研究者的假设成立;如果H0为真,就要接受H0并拒绝H1,则研究者的假设不能成立。这就是统计学上的\反证法\。H1称为备择假设就是指其是预备当H0被拒绝时以供选择的。虚无假设和备择假设互相排斥并且只有一个正确,因此H1又称为对立假设。在引子中,虚无假设为该中学高三重点班学生的平均智商与高三学生总体的平均智商没有显著差异,即H0: 1= 0,若通过平均数差异检验发现 1和 0差异显著,则拒绝H0并接受H1,即认为该中学高三重点班学生平均智商与高三学生总体的平均智商存在显著差异。

1.1.2 假设检验中的小概率事件

小概率事件就是指一个发生概率接近0的事件,也就是一般情况下不会发生的事件。例如:\双色球复式彩票的中奖率,有人计算过,中一等奖的概率为1/17721088,二等奖的概率为1/1181406,三等奖的概率为1/109389。可见,中一等奖的概率几乎接近于0,这就是一个小概率事件。

假设检验以H0为真作为前提,当有不合理的现象出现时就拒绝H0。这里的\不合理现象\就是指小概率事件发生了。小概率事件原理认为在一次试验中小概率事件是几乎不可能发生的,而在某次试验中发生了,就认为假设的前提是错误的。一般将概率选择0.05,将概率不超过0.05的事件称为\小概率事件\,也可以根据数据处理和精确度的需要将概率定为0.01或0.001。

1.1.3 假设检验的两类错误

虽然小概率事件发生的可能性很小,但仍有发生的可能。例如\双色球复式彩票的一等奖中奖率虽然微乎其微,但仍然有1/17721088的概率发生,也确有人中奖。

假设检验中的两类错误是指在假设检验中,由于样本信息的局限性,势必会产生错误,错误无非只有两种情况,在统计学中,我们一般称为Ⅰ类错误,Ⅱ类错误。

下图是研究结论和实际情况关系的矩阵:

实际情况 H0正确 I类错误 正确 H0错误 正确 II类错误 研究结论 拒绝H0 接受H0 第一类错误(Ⅰ类错误)也称为 α错误,是指当虚无假设(H0)正确时,而拒绝H0所犯的错误。这意味着研究者的结论并不正确,即观察到了实际上并不存在的处理效应。 可能产生原因: 1、样本中极端数值。 2、采用决策标准较宽松。 第二类错误(Ⅱ类错误)也称为β错误,是指虚无假设错误时,反而接受虚无假设的情况,即没有观察到存在的处理效应。 可能产生的原因: 1、实验设计不灵敏。 2、样本数据变异性过大。 3、处理效应本身比较小。 两类错误的关系: 1、 α+β不一定等于1。 2、在样本容量确定的情况下,α与β不能同时增加或减少。 3、统计检验力。(1-β) 1.1.4 单侧检验和双侧检验 根据是否强调检验的方向性,将检验分为单侧检验和双侧检验。双侧检验只关心两个总体参数之间是否有差异,而不关心谁大谁小。如引子中,研究者关心的是该中学高三重点班学生和高三学生总体的平均智商是否有差异,而不是该重点班学生的平均智商是不是高于全体高三学生的平均水平。研究的假设是: H0: 1= 0 H1: 1≠ 0 若设定显著性水平:α=0.05,双侧检验时要在总体分布的两端各设定一个临界点,如图1-3所示。临界点以外的阴影部分是拒绝H0的区域,两端阴影部分的面积比率各为0.025。 图1-3 双侧检验示意图 单侧检验则强调差异的方向性,即关心研究对象是高于还是低于某一总体水平。若引子中研究者想检验是否重点班学生的平均智商要高于全体高三学生的平均水平,这时所做的假设是:

H0: 1≤ 0 H1: 1> 0

这时拒绝H0的分布区域就在 0右边的一端了(右侧),如图1-4所示。如果假设是研究对象要低于某总体水平,拒绝H0的分布区域就在 0左边的一端了(左侧)。

图1-4 单侧检验(右侧)示意图 在实际操作中要根据研究的目的和假设来选择单侧检验还是双侧检验,如果假设中有一参数和另一参数方向性的比较,比如\大于\、\好于\、\差于\等,一般选择单侧检验。如果只是检验两参数之间是否有差异,就选择双侧检验。

1.1.5 假设检验的步骤 假设检验一般包括以下5个步骤。

(1)根据研究问题的要求提出假设,包括虚无假设H0和备择假设H1。以平均数差异检验为例,可以提出3种类型的假设。

双侧检验假设:H0: 1= 0;H1: 1≠ 0。 单侧(左侧)检验假设:H0: 1≮ 0;H1: 1< 0。 单侧(右侧)检验假设:H0: 1≯ 0;H1: 1> 0。

(2)选择合适的检验统计量。从样本情况推断总体情况需要根据条件,如抽样的方法、样本容量大小、总体分布是否正态,方差是否已知等,来选择适当的统计量。

(3)根据需要选择显著性水平 。 是犯Ⅰ型错误(错误拒绝H0)的概率,这在1.1.3节中已经介绍过了。 选择太小会导致Ⅱ型错误(错误接受H0)发生的概率增大,而 选择太大又会导致Ⅰ型错误发生的概率增大。在统计学和SPSS实际操作中,一般选择0.05或0.01作为差异的显著性水平。

(4)计算出检验统计量。运用统计学知识和工具SPSS,计算出检验统计量的数值。 (5)根据检验统计量做出统计决策。根据显著性水平 和统计量的分布,通过相关统计表找出临界值。将检验统计量的数值和临界值进行比较,看其是否落在拒绝区域,从而做出接受或拒绝虚无假设的决策。

1.2 均值比较

有了假设检验的统计学知识后,下面将具体讲解在SPSS 中如何利用假设检验的思想,对平均数的差异进行检验。在SPSS 中,是由\分析\比较均值\下的子菜单完成各种情况下的平均数差异检验的。先从最基本的\均值过程\进行介绍。

1.2.1 均值比较的主要功能

均值过程和前面的描述统计过程一样,可以对指定变量的描述性统计变量进行呈现。例如体现数据集中趋势的均值、中位数、调和平均数等,体现数据离散趋势的全距、标准差、方差等,还有体现数据分布的峰度系数和偏度系数。均值过程相对于前面的描述过程主要的优势体现在,它可以对数据进行分组,并将各组的统计检验变量放在一起进行直接比较,这样十分直观,并且省略了很多其他的过程。例如统计全国近五年酒后驾车发生交通事故的案件数量,以\省份\为分组变量来比较不同省份在近五年发生酒后驾车事故平均数量。

1.2.2 均值比较的适用条件

均值过程主要功能是统计变量的描述和不同组之间粗略的比较,因此对数据没有什么要求。需要注意的是用来形成分组的变量应该是能明确表明某种特征的变量。另外,均值过程

本文来源:https://www.bwwdw.com/article/0bxd.html

Top