统计分析软件应用(题库)-1231(1)

更新时间:2024-03-23 09:39:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

统计分析软件应用

一、判断题

1.spss可以读取excle格式的数据文件和文本文件。

2.当我们新建一个spss数据文件时,首先应在数据编辑器窗口中的数据视图中输入个案,然后再在变量视图中定义变量。

3.Spss允许同时创建或打开多个查看器窗口。

4.Spss两配对样本T检验中,两配对样本数据存放在同一个变量列上。

5.如果把“年龄”变量的缺失值指定为“99”,则如果某个被调查者的年龄回答为“300”,则就用99岁来代替。

6.Spss两独立样本T检验中,两个样本的样本容量是必须相同的。

7.如果一次随机抽样问卷调查共收回1000份问卷,两个同学建立spss数据文件各完成了500份问卷的录入工作,为便于对这次抽样调查结果进行统计分析,首先应该将两个数据文件进行横向合并。

8.Spss文件的变量名的首字符可以是汉字、字母和数字。

9.当变量分布不对称时,偏度值小于0为负偏,密度函数曲线有一条长尾拖在右边。

10.假设某数值变量服从正态分布,将其进行标准化处理后,如果某观测值标准化值小于-3,可认为是异常值。

11.对于所选答案不需要排序的多项选择题可采用多选项分类法进行分解

12.对多项选择题进行频数分析的spss操作步骤是:【分析】→【描述统计】→【频率】 13方差分析中,控制变量应为分类型变量。

14.pearson简单相关系数r 的绝对值接近0时,说明两变量没有相关关系。

15.在一元线性回归分析中,对回归方程的F检验和对回归系数的T检验的作用是相同的。 二、案例分析题

1.某工厂改进了技术,调查者随机抽取了15名工人,调查他们在工艺改进前后生产100件产品的时间,数据如下表,试在5%显著性水平下,检验零件加工时间是否显著减少?

改进前 70 76 58 63 63 56 58 60 65 65 75 66 56 59 70 64 减少。

1

改进后 48 54 60 64 48 55 54 45 51 48 56 48 64 50 54 53 以下是用spss成对样本T检验的输出结果,请填写表中的空格,并根据输出结果回答零件加工时间是否显著

程對差異數 標準錯標準偏 對組 1 改进前 - 改进后 平均數 10.733 差 9.573 誤平均值 2.472 下限 5.432 95% 差異數的信賴區間 上限 16.035 T .001 df 显著性(双尾) 2.现有甲乙丙三个工厂分别生产某种电池,现在从每个厂家生产的电池中各抽取12个检验其寿命,在5%的显著性水平下,检验三个厂家的电池寿命是否具有显著差异。

以下是spss方差分析的输出结果:

變異數同質性測試

电池寿命 Levene 統計資

.390

變異數分析 电池 寿命 群組之間 在群組內 總計 多重比較 因變數: 电池 寿命 LSD 95% 信賴區間 (I) 企业 1 (J) 企业 2 3 2 1 3 3 1 2

*. 平均值差異在 0.05 層級顯著。

要求填写表中空格,并根据以上输出结果回答:

2

平均差異 (I-J) 10.917 -.583 -10.917 -11.500 .583 11.500 ****df1

2

df2

33

顯著性

.680

平方和 1007.056 428.583 1435.639 df 2 35 平均值平方 12.987 F 顯著性 .000 標準錯誤 1.471 1.471 1.471 1.471 1.471 1.471 顯著性 .000 .694 .000 .000 .694 .000 下限 7.92 -3.58 -13.91 -14.49 -2.41 8.51 上限 13.91 2.41 -7.92 -8.51 3.58 14.49

(1) 三个厂家生产的电池寿命是否满足方差齐性的假设,为什么? (2) 三个厂家生产的电池使用寿命是否存在显著差异,为什么? (3) 对多重比较的结果进行分析说明。

3、为了研究某健身器材三个品牌(A、B、C)需求,商场对消费了该健身器材的顾客进行了随机抽样调查。调查结果的频数分析结果如下:

表1 统计量

N

有效 缺失

均值 方差 偏度

偏度的标准误 峰度

峰度的标准误 百分位数

25 50 75

请根据频数分析结果回答: (1)该样本有无缺失值? (2)该样本的中位数为多少?

(3) 该样本的分布形态如何?(分别描述分布的对称性、陡缓程度)。

4、在进行某项调查时,有一栏人口统计学信息为“学历”,其频数分析结果如下:

表2 学历 有效 小学或以下 中学或中专 大专 本科 硕士或以上 合计

5、现对每月信用卡消费(元)做描述分析,并通过标准化过程,寻找异常值。其中Z月信用卡消费为标准化的数据。

表3 月信用卡消费的描述分析

3

频率 20 723 230 118 20 1111 百分比 1.8 65.1 20.7 10.6 1.8 100.0 有效百分比 1.8 65.1 20.7 10.6 1.8 100.0 累积百分比 1.8 66.9 87.6 98.2 100.0 购买品牌 338 0 2.2811 0.672 -0.560 0.133 -1.287 0.265 2.0000 3.0000 3.0000

请根据频数分析结果,绘制频数分析的条形图。

月信用卡消费(元) 6661.7 16762.4 7752.6 4987.2 5849.2 11923.4 10.2 4246.8 8544.1 89975.8 5521.8 5741.9 5698.3 6841.7 4859.2 根据描述分析结果回答:

(1)请写出数据标准化的数字定义式:Z=

(2)该样本中是否有异常值?哪个是异常值,为什么? 【参考答案】

Z月信用卡消费 -0.26141 0.20209 -0.21135 -0.33825 -0.29869 -0.01996 -0.56663 -0.37222 -0.17503 3.56165 -0.31371 -0.30361 -0.30562 -0.25315 -0.34412 (1)

准则,为异常值。

(2)有异常值,为89975.8。因为如果标准化值的绝对值大于3,根据统计学经典389975.8的标准化值为3.56165,大于3,因此为异常值。

6、为了研究某公司内30个员工的月基本工资,收集了30个员工的月基本工资数据,并进行了单样本T检验。表4为单个样本统计量,表5为单个样本的检验。

表4 单个样本统计量 月基本工资

表5 单个样本检验 检验值 = 4500 t 月基本工资 5.963 df 29 Sig.(双侧) 0.000 均值差值 1529.00000 差分的 95% 置信区间 下限 1004.5314 上限 2053.4686 N 30 均值 6029.0000 标准差 1404.55257 均值的标准误 256.43504 请根据单样本T检验的相关知识回答: (1)该检验中,原假设

是什么?

(2)该检验是拒绝原假设还是不拒绝原假设?为什么?

4

(3)该公司内员工的月基本工资在95%的置信区间内,分布在多少范围之间? 【参考答案】 (1)原假设

(2)根据假设检验的判定标准,若p<验的p=0.000<

7、为了研究高校每年投入高级职称的人员数和每年发表的论文数的关系,做了如下相关分析。

,则拒绝原假设;若p>

,则不能拒绝原假设。该单样本T检

,因此拒绝原假设,即:这30人员工的月基本工资平均值不为4500。

(3)置信区间为(4500+1004.5314,4500+2053.4686)=(5504.5314,6553.4686)

图1

表 相关性 投入高级职称的人员数 Pearson 相关性 显著性(双侧) N 论文数 Pearson 相关性 显著性(双侧) N 31 0.953 0.000 31 31 **投入高级职称的人年数 1 论文数 0.953 0.000 31 1 ****. 在 .01 水平(双侧)上显著相关。 请根据相关分析结果回答: (1)在相关分析中,图1的名称叫什么?它有什么作用? (2)该分析使用的是哪种相关系数?高校每年投入高级职称的人员数和每年发表的论文数的相关系数为多少?

【参考答案】

(1)散点图。散点图是相关分析过程中极为常用的直观分析方式,能够直观发现变量间的统计关系以及强弱程度。

(2)使用的是Pearson相关系数。相关系数为0.953。

8、为了测量不同种类的饲料对家畜(猪)的体重影响,对24头家畜(猪)分别进行了3种饲料的喂养。

5

本文来源:https://www.bwwdw.com/article/inp8.html

Top