《应用回归分析》课后习题部分答案-何晓群版

更新时间:2023-03-08 09:26:19 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

回归分析

作业设计

班级: 统计0802 学号: 1303080513 姓名: 刘贯春 指导老师: 胡朝明

日期:2011年1月2日

实验目的:结合SPSS软件使用回归分析中的各种方法,比较各种方

法的使用条件,并正确解释分析结果。

实验内容:世纪统计学教材应用回归分析(第二版)课后有数据的习

题。

详细设计:

第二章 一元线性回归

2.14 解答:(1)散点图为:

(2)x与y之间大致呈线性关系。 (3)设回归方程为y??0??1x

n???? ?1=

?xyii?1n??i?nxy??7

2?xi?1?2i?n(x)??0?y??1x?20?7?3??1

1

?

??可得回归方程为y??1?7x?2

(4)??(y?n-2i=11ni?2?yi)

2 ?1n-2n?(yi=1?i??(?0??1x))

222?10-(-1+7?1))?(10-(-1+7?2))?(20-(-1+7?3))?1( =?? 223??(20-(-1+7?4))?(40-(-1+7?5))?

?13?16?9?0?49??36

?110/3?1330?6 .1 ??3?(5)由于?1?N(?1,??2Lxx?)

t??1??1?/Lxx2?(?1??)Lxx? ?服从自由度为n-2的t分布。因而 ???(?1??)LxxP?||?t?/2(n?2)??1?? ??????????也即:p(?1?t?/2??Lxx??1??1?t?/2?Lxx)=1??

1313可得?1的置信度为95%的置信区间为(7-2.353?即为:(2.49,11.5)

??33,7+2.353?33)

?0?N(?0,(1n?(x)2Lxx)?)

22

??t?(1n?0??0???2??0??0?

2?(x)2Lxx)??1n?(x)Lxx 服从自由度为n-2的t分布。因而

????????0??0P?||?t?/2(n?2)??1??

?2???1(x)????nLxx???????即p(?0???1n?(x)2???Lxxt?/2??0??0??1n?(x)2Lxxt?/2)?1??

可得?1的置信度为95%的置信区间为(?7.77,5.77)

n(6)x与y的决定系数r2??(y?y)ii?1n??2?(yi?1?i?490/600?0.817

2?y)(7)

ANOVA x 组间 (组合) 线性项 加权的 偏差 组内 总数 平方和 9.000 8.167 .833 1.000 10.000 df 2 1 1 2 4 均方 4.500 8.167 .833 .500 F 9.000 16.333 1.667 显著性 .100 .056 .326 由于F?F?(1,3),拒绝H0,说明回归方程显著,x与y有显著的线性关系。

??(8)t??1?2??1?Lxx?2 其中???/Lxx?e?n?2i?11n2i?(y?n?2i?11ni?2?yi)

3

?7?1310330?21?3.6 633t?/2?2.353 t?3.66?t?/2

?接受原假设H0:?1?0,认为?1显著不为0,因变量y对自变量x的一元线性回归成立。

n?(x(9)相关系数 r?i?1n?i??x)(yi?y)?n2??iLxyLxxLyy

?(xi?1i?x)?(yi?1?y) =7010?600?760?0.904

r小于表中??1%的相应值同时大于表中??5%的相应值,?x与y有显著的线性关系.

(10) 序号 1 2 3 4 5 残差图为:

x y ?y e 1 2 3 4 5 10 10 20 20 40 6 13 20 27 34 4 -3 0 -7 6 4

从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。

置信度为95%的置信区间 (11)当广告费x0=4.2万元时,销售收入y0?28.4万元,??近似为y?2?,即(17.1,39.7)

2.15 解答:

(1) 散点图为:

5

(2)x与y之间大致呈线性关系。 (3)设回归方程为y??0??1x

n???? ?1=

?xyii?1n??i?nxy??2(26370?21717)(7104300?5806440)?0.0036

?xi?1?2i?n(x)??0?y??1x?2.85?0.0036?762?0.1068

???可得回归方程为y?0.1068?0.0036x?2

(4) ??(y?n-2i=11ni?2?yi)

2 ?1n-2n?(yi=1?i??(?0??1x))

6

=0.2305

??0.4801

??(5) 由于?1?N(?1,??2Lxx)

?t??1??1?/Lxx2?(?1??)Lxx? ?服从自由度为n-2的t分布。因而 ???(?1??)LxxP?||?t?/2(n?2)??1?? ??????????也即:p(?1?t?/2??Lxx??1??1?t?/2?Lxx)=1??

可得?1的置信度为95%的置信区间为

(0.0036-1.860?0.4801/1297860,0.0036+1.860?0.4801/1297860)

即为:(0.0028,0.0044)

???0?N(?0,(?1n?(x)2Lxx)?)

?2t?(1n?0??0???2??0??0?

2?(x)2Lxx)??1n?(x)Lxx 服从自由度为n-2的t分布。因而

????????0??0P?||?t?/2(n?2)??1??

?2???1(x)????nLxx???????即p(?0??

1n?(x)2???Lxxt?/2??0??0??1n?7

(x)2Lxxt?/2)?1??

?可得?1的置信度为95%的置信区间为(?0.3567,0.5703)

n(6)x与y的决定系数 r2??(y?y)ii?1n??2?(yi?1?i?216.8202718.525=0.908

?y)(7) ANOVA x 组间 (组合) 线性项 加权的 偏差 组内 总数 平方和 1231497.500 1168713.036 62784.464 66362.500 1297860.000 df 7 1 6 2 9 均方 175928.214 1168713.036 10464.077 33181.250 F 5.302 35.222 .315 显著性 .168 .027 .885 由于F?F?(1,9),拒绝H0,说明回归方程显著,x与y有显著的线性关系。

??(8) t??1?2??1?Lxx?2 其中???/Lxx ?0.003?6?e?n?2i?11n2i?(y?n?2i?11ni?2?yi)

1297860?8.54 20.04801t?/2?1.895 t?8.542?t?/2

?接受原假设H0:?1?0,认为?1显著不为0,因变量y对自变量x的一元线性回归成立。

n?(x(9) 相关系数 r?i?1n?i??x)(yi?y)?n2??LxyLxxLyy

?i?1(xi?x)?i?1(yi?y) =46531297860?18.525?0.9489

8

r小于表中??1%的相应值同时大于表中??5%的相应值,?x与y有显著的线性关系.

(10) 序号 1 2 3 4 5 6 7 8 9 10 x y ?y e 825 215 1070 550 480 920 1350 325 670 1215 3.5 1 4 2 1 3 4.5 1.5 3 5 3.0768 0.8808 3.9588 2.0868 1.8348 3.4188 4.9688 1.2768 2.5188 4.4808 0.4232 0.1192 0.0412 -0.0868 -0.8348 -0.4188 -0.4668 0.2232 0.4812 0.5192

从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。

(11)新保单x0?1000时,需要加班的时间为y0?3.7小时。

(12)y0的置信概率为1-?的置信区间精确为y0?t?/2(n?2)1?h00?, 即为(2.7,4.7)

近似置信区间为:y0?2?,即(2.74,4.66)

(13)可得置信水平为1-?的置信区间为y0?t?/2(n?2)h00?,即为(3.33,4.07). 2.16 (1)散点图为:

???????9

可以用直线回归描述y与x之间的关系. (2)回归方程为:y?12112.629?3.314x (3)

? 10

从图上可看出,检验误差项服从正态分布。

第三章 多元线性回归

3.11 解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵: 相关性 Pearson 相关性 y x1 x2 x3 y x1 x2 y 1.000 .556 .731 .724 . .048 .008 x1 .556 1.000 .113 .398 .048 . .378 11

x2 .731 .113 1.000 .547 .008 .378 . x3 .724 .398 .547 1.000 .009 .127 .051

x3 N y x1 x2 x3 .009 10 10 10 10 .127 10 10 10 10 .051 10 10 10 10 . 10 10 10 10 所以~r=

系数a 模型 非标准化系数 B 1 (常量) 标准系数 t Sig. -1.974 B 的 95.0% 置信区间 下限 上限 零阶 相关性 偏 部分 共线性统计量 容差 VIF 标准 误差 试用版 176.459 -348.280 .096 -780.083.500 60 .556 .731 .724 .825 .687 .586 1.211 1.455 1.708 x1 x2 x3 3.754 7.101 12.447 1.933 2.880 10.569 .385 1.942 .535 2.465 .277 1.178 .100 .049 -.977 8.485 .053 14.149 .621 .350 .709 .444 .433 .212 .284 -13.4138.310 5 a. 因变量: y (2)

???348.28?3.754x1?7.101x2?12.447x3 所以三元线性回归方程为y模型汇总 模型 R 1 .898a R 方 .806 调整 R 方 .708 标准 估计的误差 23.44188 R 方更改 .806 F 更改 8.283 更改统计量 df1 3 df2 6 Sig. F 更改 .015 a. 预测变量: (常量), x3, x1, x2。 (3) 由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高

(4)

Anovab 模型 平方和 df 均方 12

F Sig. 1 回归 残差 总计 13655.370 3297.130 16952.500 3 6 9 4551.790 549.522 8.283 .015a a. 预测变量: (常量), x3, x1, x2。 b. 因变量: y

因为F=8.283 P=0.015<0.05所以认为回归方程在整体上拟合的好

(5)

系数a 模型 非标准化系数 B 1 (常量) x1 x2 x3 a. 因变量: y 3.754 7.101 12.447 1.933 2.880 10.569 .385 1.942 .100 .535 2.465 .049 .277 1.178 .284 -.977 .053 -13.415 8.485 14.149 38.310 .556 .731 .724 .621 .709 .433 .350 .444 .212 .825 1.211 .687 1.455 .586 1.708 -348.280 标准 误差 176.459 标准系数 试用版 t Sig. 下限 -780.060 B 的 95.0% 置信区间 上限 83.500 零阶 相关性 偏 部分 共线性统计量 容差 VIF -1.974 .096

(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。

去除x3后作F检验,得: Anovab 模型 1 回归 残差 总计 平方和 12893.199 4059.301 16952.500 df 2 7 9 均方 6446.600 579.900 F 11.117 Sig. .007a a. 预测变量: (常量), x2, x1。 b. 因变量: y

由表知通过F检验 继续做回归系数检验

13

系数a 模型 非标准化系数 B 1 (常量) -459.624 x1 x2 4.676 8.971 标准系数 t Sig. B 的 95.0% 置信区间 下限 -821.547 .381 3.134 上限 -97.700 8.970 14.808 相关性 零阶 偏 部分 共线性统计量 容差 VIF 标准 误差 试用版 153.058 1.816 2.468 .479 .676 -3.003 .020 2.575 3.634 .037 .008 .556 .731 .697 .808 .476 .672 .987 1.013 .987 1.013 a. 因变量: y

此时,我们发现x1,x2的显著性大大提高。

(7)x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)

?*?0.385x1*?0.535x2*?0.277x3* (8)y(9) 残差统计量a 预测值 标准 预测值 预测值的标准误差 调整的预测值 残差 标准 残差 Student 化 残差 已删除的残差 Student 化 已删除的残差 Mahal。 距离 Cook 的距离 居中杠杆值 a. 因变量: y 极小值 175.4748 -1.438 10.466 188.3515 -25.19759 -1.075 -2.116 -97.61523 -3.832 .894 .000 .099 极大值 292.5545 1.567 20.191 318.1067 33.22549 1.417 1.754 50.88274 2.294 5.777 3.216 .642 均值 231.5000 .000 14.526 240.1835 .00000 .000 -.123 -8.68348 -.255 2.700 .486 .300 标准 偏差 38.95206 1.000 3.127 49.83914 19.14022 .816 1.188 43.43220 1.658 1.555 .976 .173 N 10 10 10 10 10 10 10 10 10 10 10 10

所以置信区间为(175.4748,292.5545)

(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好

3.12 解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产

14

业每增加一个单位,GDP就增加0.607个单位。

在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,GDP就增加1.709个单位。

第四章 违背基本假设的情况

4.9 解: 系数a 模型 非标准化系数 B 1 (常量) x a. 因变量: y -.831 .004 标准 误差 .442 .000 标准系数 试用版 t -1.882 .839 11.030 Sig. .065 .000 ?=-0.831+0.004x 由SPSS计算得:y残差散点图为:

15

(2)由残差散点图可知存在异方差性 再用等级相关系数分析: 相关系数 Spearman 的 rho x 相关系数 Sig.(双侧) N t 相关系数 Sig.(双侧) N x 1.000 . 53 .318* .021 53 t .318* .021 53 1.000 . 53 *. 在置信度(双测)为 0.05 时,相关性是显著的。

P=0.021 所以方差与自变量的相关性是显著的。 (3) 模型描述 因变量 自变量 权重 1 源 幂值 模型: MOD_1. y x x 1.500

M=1.5时可以建立最优权函数,此时得到: ANOVA 回归 残差 总计 平方和 .006 .003 .009 df 1 51 52 均方 .006 .000 F 98.604 Sig. .000 系数 (常数)

未标准化系数 B -.683 标准误 .298 标准化系数 试用版 标准误 t -2.296 Sig. .026 16

系数 (常数) x 未标准化系数 B -.683 .004 标准误 .298 .000 标准化系数 试用版 标准误 t -2.296 .082 9.930 Sig. .026 .000 .812

所以:y??-0.683+0.004x (4) 系数a 模型 非标准化系数 B 1 (常量) x a. 因变量: yy .582 .001 标准 误差 .130 .000 标准系数 试用版 t 4.481 .805 9.699 Sig. .000 .000

17

4.13 解: (1) 系数a 模型 非标准化系数 B 1 (常量) x a. 因变量: y -1.435 .176 标准 误差 .242 .002 标准系数 试用版 t -5.930 .999 107.928 Sig. .000 .000

?y=-1.435+0.176x

模型汇总b (2) 模型 R 1 .999a R 方 .998 调整 R 方 .998 标准 估计的误差 .09744 Durbin-Watson .663 a. 预测变量: (常量), x。 b. 因变量: y

DW=0.663 查DW分布表知:dL=0.95 所以DW

18

et随t的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。

?=1-0.5*DW=0.6685 计算得: (3)?Y’ x’ 7.39 44.90 7.65 45.80 6.84 40.69 8.00 48.50 7.79 46.85 8.26 49.45 7.96 48.47 8.28 50.04 7.90 48.03 8.49 51.17 7.88 47.26 8.77 52.33 8.93 52.69 9.32 54.95 9.29 55.54 9.48 56.77 9.38 55.83 9.67 58.00 9.90 59.22

19

模型汇总b 模型 R 1 .996a R 方 .993 调整 R 方 .993 标准 估计的误差 .07395 Durbin-Watson 1.344 a. 预测变量: (常量), xx。 b. 因变量: yy 系数a 模型 非标准化系数 B 1 (常量) xx a. 因变量: yy -.303 .173 标准 误差 .180 .004 标准系数 试用版 t -1.684 .996 49.011 Sig. .110 .000 ?'=-0.303+0.173x’ 得回归方程 y?t=-0.303+0.6685yt?1+0.173(xt—0.6685xt?1) 即:y(4)

模型汇总b 模型 R 1 .978 a标准 估计的误R 方 .957 调整 R 方 .955 差 .07449 Durbin-Watson 1.480 a. 预测变量: (常量), x3。 b. 因变量: y3 系数a 模型 非标准化系数 B 1 (常量) x3 a. 因变量: y3 20

.033 .161 标准 误差 .026 .008 标准系数 试用版 t 1.273 .978 19.528 Sig. .220 .000

△yt=0.033+0.161△xt

?t=0.033+yt?1+0.161(xt-xt?1) 即:y(5)差分法的DW值最大为1.48消除相关性最彻底,但是迭代法的??值最小为0.07395,拟合的较好。

4.14解:(1) 模型汇总b 模型 R 1 .541a R 方 .293 调整 R 方 .264 标准 估计的误差 329.69302 Durbin-Watson .745 a. 预测变量: (常量), x2, x1。 b. 因变量: y 系数a 模型 非标准化系数 B 1 (常量) x1 x2 a. 因变量: y -574.062 191.098 2.045 标准 误差 349.271 73.309 .911 标准系数 试用版 t -1.644 .345 .297 2.607 2.246 Sig. .107 .012 .029

?=-574.062+191.098x1+2.045x2 回归方程为:yDW=0.745

残差图为:

21

?=1-0.5*DW=0.6275 (2)? 模型汇总b 模型 R 1 .688 a标准 估计的误R 方 .474 调整 R 方 .452 差 257.67064 Durbin-Watson 1.716 a. 预测变量: (常量), x22, x12。 b. 因变量: y2 系数a 模型 非标准化系数 B 1 (常量) x12 x22 a. 因变量: y2 -179.668 211.770 1.434 标准 误差 90.337 47.778 .628 标准系数 试用版 t -1.989 .522 .269 4.432 2.283 Sig. .052 .000 .027

?t’=-179.668+211.77x1’+1.434x2’ 此时得方程:y22

所以回归方程为:

?t??179.668?0.6275yt?1?211.77(x1t?0.6275x1t?1?)?1.434(x2t?0.6275x2t?1) y

(3) 模型汇总 模型 R 1 .715a R 方 .511 调整 R 方 .490 标准 估计的误差 283.79102 Durbin-Watson 2.042 ba. 预测变量: (常量), x23, x13。 b. 因变量: y3 系数 模型 非标准化系数 B 1 (常量) x13 x23 a. 因变量: y3 7.698 209.891 1.399 标准 误差 39.754 44.143 .583 标准系数 试用版 t .194 .544 .274 4.755 2.400 Sig. .847 .000 .020 a

?t?7.698?209.891?x1?1.399?x2 此时得方程:△y?t?7.698?209.891(xt?xt?1)?1.399(x2t?x2t?1)所以回归方程为:y

第五章 自变量选择与逐步回归

5.9 后退法:输出结果

系数a 模型 非标准化系数 B 1

(常量) 1438.120 标准 误差 2252.472 23

标准系数 试用版 t .638 Sig. .533 农业x1 工业x2 建筑业x3 人口x4 最终消费x5 受灾面积x6 2 (常量) 农业x1 工业x2 建筑业x3 最终消费x5 受灾面积x6 3 (常量) 农业x1 工业x2 最终消费x5 受灾面积x6 4 (常量) 农业x1 工业x2 最终消费x5 a. 因变量: 财政收入y -.626 -.328 -.383 -.004 .672 -.006 1079.754 -.642 -.303 -.402 .658 -.006 1083.150 -.624 -.373 .657 -.005 874.604 -.611 -.353 .637 .168 .207 .555 .025 .130 .008 299.759 .130 .131 .525 .095 .007 295.816 .127 .093 .094 .007 106.869 .124 .088 .089 -1.098 -1.352 -.251 -.014 3.710 -.015 -3.720 -1.587 -.691 -.161 5.178 -.695 3.602 -4.925 -2.314 -.765 6.905 -.849 3.662 -4.931 -3.998 6.981 -.758 8.184 -4.936 -3.994 7.142 .002 .135 .501 .875 .000 .499 .003 .000 .035 .456 .000 .409 .002 .000 .001 .000 .460 .000 .000 .001 .000 -1.126 -1.249 -.263 3.636 -.017 -1.095 -1.535 3.627 -.015 -1.073 -1.454 3.516 Anovae 模型 1 回归 残差 总计 2 回归 残差 总计 3 回归 残差 总计 4 回归 平方和 1.365E8 528793.319 1.370E8 1.365E8 529767.852 1.370E8 1.364E8 550440.103 1.370E8 1.364E8 df 6 14 20 5 15 20 4 16 20 3 24

均方 2.274E7 37770.951 F 602.127 Sig. .000a 2.729E7 35317.857 772.734 .000b 3.411E7 34402.506 991.468 .000c 4.547E7 1355.753 .000d

残差 总计 570180.931 1.370E8 17 20 33540.055 a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。 b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。 c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。 d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。 e. 因变量: 财政收入y 模型汇总 模型 标准 估计的误R 1 2 3 4 .998a .998b .998c .998d R 方 .996 .996 .996 .996 调整 R 方 .994 .995 .995 .995 差 194.34750 187.93046 185.47913 183.13944 R 方更改 .996 .000 .000 .000 F 更改 602.127 .026 .585 .574 df1 6 1 1 1 df2 14 14 15 16 更改统计量 Sig. F 更改 .000 .875 .456 .460 a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。 b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。 c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。 d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。 回归方程为:y?874.604?0.611x1?0.353x2?0.637x5

逐步回归法:输出结果

模型汇总 模型 标准 估计的误R 1 2 3 .994a .996b .998c R 方 .989 .992 .996 调整 R 方 .988 .991 .995 差 285.68373 247.77768 183.13944 R 方更改 .989 .003 .004 F 更改 1659.441 7.258 15.948 df1 1 1 1 df2 19 18 17 更改统计量 Sig. F 更改 .000 .015 .001 ?a. 预测变量: (常量), 最终消费x5。 b. 预测变量: (常量), 最终消费x5, 农业x1。 c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。

25

Anovad 模型 1 回归 残差 总计 2 回归 残差 总计 3 回归 残差 总计 平方和 1.354E8 1550688.654 1.370E8 1.359E8 1105088.003 1.370E8 1.364E8 570180.931 1.370E8 df 1 19 20 2 18 20 3 17 20 均方 1.354E8 81615.192 F 1659.441 Sig. .000a 6.794E7 61393.778 1106.637 .000b 4.547E7 33540.055 1355.753 .000c a. 预测变量: (常量), 最终消费x5。 b. 预测变量: (常量), 最终消费x5, 农业x1。 c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。 d. 因变量: 财政收入y 系数a 模型 非标准化系数 B 1 (常量) 最终消费x5 2 (常量) 最终消费x5 农x1 3 (常量) 最终消费x5 农x1 工x2 26

业-.353 .088 -1.454 -3.994 .001 .992 -.696 -.062 业-.611 .124 -1.073 -4.936 .000 .987 -.767 -.077 874.604 .637 106.869 .089 业-.414 .154 -.726 -2.694 .015 .987 -.536 -.057 1011.912 .311 136.901 .049 710.372 .180 标准 误差 90.891 .004 标准系数 试用版 t 7.816 .994 40.736 Sig. .000 .000 零阶 相关性 偏 部分 .994 .994 .994 1.718 7.392 6.374 .000 .000 .994 .832 .135 3.516 8.184 7.142 .000 .000 .994 .866 .112 系数a 模型 非标准化系数 B 1 (常量) 最终消费x5 2 (常量) 最终消费x5 农x1 3 (常量) 最终消费x5 农x1 工x2 a. 因变量: 财政收入y 业-.353 .088 -1.454 -3.994 .001 .992 -.696 -.062 业-.611 .124 -1.073 -4.936 .000 .987 -.767 -.077 874.604 .637 106.869 .089 业-.414 .154 -.726 -2.694 .015 .987 -.536 -.057 1011.912 .311 136.901 .049 710.372 .180 标准 误差 90.891 .004 标准系数 试用版 t 7.816 .994 40.736 Sig. .000 .000 零阶 相关性 偏 部分 .994 .994 .994 1.718 7.392 6.374 .000 .000 .994 .832 .135 3.516 8.184 7.142 .000 .000 .994 .866 .112 回归方程为:y?874.604?0.636x1?0.353x2?0.637x5

5.10 (1) 模型汇总 模型 R 1 2 .908a .000b R 方 .824 .000 调整 R 方 .736 .000 标准 估计的误差 625.88326 1217.15945 ?a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量) Anovac 模型 1 回归 残差 总计 平方和 1.830E7 3917298.522 2.222E7 df 5 10 15 27

均方 3660971.683 391729.852 F 9.346 Sig. .002a 2 回归 残差 总计 .000 2.222E7 2.222E7 0 15 15 .000 1481477.129 . .b a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量) c. 因变量: y 系数a 模型 非标准化系数 B 1 (常量) x2 x3 x4 x5 x6 2 (常量) 5922.827 4.864 2.374 -817.901 14.539 -846.867 7542.938 标准 误差 2504.315 2.507 .842 187.279 147.078 291.634 304.290 标准系数 试用版 t 2.365 .677 .782 -1.156 .050 -.899 1.940 2.818 -4.367 .099 -2.904 24.789 Sig. .040 .081 .018 .001 .923 .016 .000 a. 因变量: y 回归方程为:y?5922.827?4.864x2?2.374x3?817.901x4?14.539x5?846.867x6 (2)后退法:输出结果 模型汇总 模型 R 1 2 .908a .907b R 方 .824 .824 调整 R 方 .736 .759 标准 估计的误差 625.88326 597.04776 ?a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量), x6, x3, x2, x4。 Anovac 模型 1 回归 残差 总计

平方和 1.830E7 3917298.522 2.222E7 df 5 10 15 28

均方 3660971.683 391729.852 F 9.346 Sig. .002a 2 回归 残差 总计 1.830E7 3921126.262 2.222E7 4 11 15 4575257.669 356466.024 12.835 .000b a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量), x6, x3, x2, x4。 c. 因变量: y 系数a 模型 非标准化系数 B 1 (常量) x2 x3 x4 x5 x6 2 (常量) x2 x3 x4 x6 a. 因变量: y ?标准系数 试用版 t 2.365 .677 .782 -1.156 .050 -.899 1.940 2.818 -4.367 .099 -2.904 2.675 .706 .760 -1.165 -.916 3.727 4.750 -4.913 -3.711 Sig. .040 .081 .018 .001 .923 .016 .022 .003 .001 .000 .003 标准 误差 2504.315 2.507 .842 187.279 147.078 291.634 2245.481 1.360 .486 167.776 232.489 5922.827 4.864 2.374 -817.901 14.539 -846.867 6007.320 5.068 2.308 -824.261 -862.699 y?6007.320?5.068x2?2.308x3?824.261x4?862.699x6

(3)逐步回归 模型汇总 模型 R 1 2 3 .498a .697b .811c R 方 .248 .485 .657 调整 R 方 .194 .406 .572 标准 估计的误差 1092.83206 937.95038 796.60909 a. 预测变量: (常量), x3。 29

b. 预测变量: (常量), x3, x5。 c. 预测变量: (常量), x3, x5, x4。

Anovad 模型 1 回归 残差 总计 2 回归 残差 总计 3 回归 残差 总计 a. 预测变量: (常量), x3。 b. 预测变量: (常量), x3, x5。 c. 预测变量: (常量), x3, x5, x4。 d. 因变量: y 平方和 5502210.090 1.672E7 2.222E7 1.079E7 1.144E7 2.222E7 1.461E7 7615032.418 2.222E7 df 1 14 15 2 13 15 3 12 15 均方 5502210.090 1194281.918 F 4.607 Sig. .050a 6.130 .013b 5392697.554 879750.910 4869041.506 634586.035 7.673 .004c 系数a 模型 非标准化系数 B 1 (常量) x3 2 (常量) x3 x5 3 (常量) x3 x5 x4 a. 因变量: y 5161.259 1.511 472.298 3.188 212.325 1412.807 3.440 348.729 -415.136 标准 误差 1142.744 .704 2150.138 .913 86.643 1865.912 .782 92.220 169.163 标准系数 试用版 t 4.517 .498 2.146 .220 3.492 2.451 .757 4.398 3.782 -2.454 Sig. .000 .050 .830 .004 .029 .464 .001 .003 .030 1.050 .737 1.133 1.210 -.587 y?1412.807?3.440x3?348.729x5?415.136x4

?(4)两种方法得到的模型是不同的,回退法剔除了x5,保留了x6, x3, x2, x4

30

作为最终模型。而逐步回归法只引入了x3。说明了方法对自变量重要性的认可不同的,这与自变量的相关性有关联。相比之下,后退法首先做全模型的回归,每一个变量都有机会展示自己的作用,所得结果更有说服力

第六章 多重共线性的情形及其处理

6.6

解:由下表我们可以看出

系数 模型 非标准化系数 B 1 (常量) x1 x2 x3 x4 x5 x6 a. 因变量: y -6381.575 -.593 .549 -.756 .080 .006 -.010 标准 误差 2736.958 .279 .199 .911 .031 .006 .014 标准系数 试用版 t -2.332 -2.127 2.753 -.830 2.590 .918 -.750 Sig. .035 .052 .016 .420 .021 .374 .466 共线性统计量 容差 VIF a -1.040 2.260 -.495 .281 .038 -.027 .003 .001 .002 .064 .434 .574 318.536 897.470 472.951 15.706 2.305 1.742 方差扩大因子最大的为VIF2=897.470,故首先应剔除变量x2.将剩下变量继续进行回归得下表: 系数 模型 非标准化系数 B 1 (常量) x1 x3 x4 x5 x6 a. 因变量: y -2677.422 -.053 1.433 .036 .006 .002 标准 误差 2858.846 .237 .533 .032 .008 .015 标准系数 试用版 t -.937 -.221 2.690 1.137 .822 .157 Sig. .364 .828 .017 .274 .424 .878 共线性统计量 容差 VIF a -.092 .937 .127 .041 .006 .006 .009 .087 .434 .647 160.620 112.478 11.509 2.303 1.545 此时,有最大的方差扩大因子VIF1=160.620,且此时x1系数为负,故x1也应被剔除,继续将剩下变量进行回归得:

31

系数a 模型 非标准化系数 B 1 (常量) x3 x4 x5 x6 a. 因变量: y -2214.129 1.318 .031 .006 .003 标准 误差 1888.503 .109 .019 .007 .015 标准系数 试用版 t -1.172 .862 .107 .041 .008 12.068 1.586 .841 .209 Sig. .258 .000 .132 .412 .837 共线性统计量 容差 VIF .199 .221 .434 .671 5.023 4.523 2.302 1.489 此时,所有方差扩大因子都小于10,故回归方程如下:

?y=-2214.129+1.318x3+0.031x4+0.006x5+0.003x6

32

本文来源:https://www.bwwdw.com/article/ilq3.html

Top