基于回归分析的人口预测

更新时间:2024-01-30 08:11:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

统计系课程实验论文

基于回归分析的人口数量预测

学 号: 姓 名: 年 级: 专 业: 课 程: 指导教师: 完成日期:

2014962005 李洋 2014级 统计学 回归分析 姜喜春 2016年6月19日

目 录

摘 要 .................................................................................................................................... I 前 言 ................................................................................................................................... 1 第1章 一元线性回归 ......................................................................................................... 2

1.1 指标的选择 ............................................................................................................ 2 1.2 样本确定 ................................................................................................................ 2 1.3 一元回归分析 ........................................................................................................ 3

1.3.1 绘制总人口与粮食产量的散点图 ........................................................... 3 1.3.2 设定理论模型 ........................................................................................... 4 1.3.3 回归诊断 ................................................................................................... 4

第2章 多元线性回归 ......................................................................................................... 5

2.1 数据中心化标准化 .............................................................................................. 5 2.2 多元回归模型建立 .............................................................................................. 5 2.3 逐步回归法 .......................................................................................................... 6 2.4 多重共线性 ........................................................................................................ 7

2.3.1 多重共线性检测 ....................................................................................... 8 2.4 主成分分析 .......................................................................................................... 9

2.4.1 主成分分析模型建立 ............................................................................... 9

第3章 非线性模型 ......................................................................................................... 11

3.1 曲线回归 ............................................................................................................ 11

3.1.1 曲线拟合 ................................................................................................. 11 3.2 Logistic模型 ...................................................................................................... 13 结 论 ................................................................................................................................. 15 参考文献 ............................................................................................................................. 16

理学院 统计系 课程实验论文 摘 要

回归分析法是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。同时依据事物发展变化的因果关系来预测事物未来的发展走势,它是研究变量间相互关系的一种定量预测方法,又称回归模型预测法或因果法,应用于经济预测、科技预测和企业人力资源的预测等。回归分析可以说是统计学中内容最丰富、应用最广泛的分支。这一点几乎不带夸张。包括最简单的t检验、方差分析也都可以归到线性回归的类别。而卡方检验也完全可以用logistic回归代替。

众多回归的名称张口即来的就有一大片,线性回归、logistic回归、cox回归、poission回归、probit回归等等。

关键词:线性回归;非线性回归;logistic回归

I

理学院 统计系 课程实验论文 前 言

最早的形式回归的方法是最小二乘法 ,这是在1805年出版的勒让德 ,和高斯在1809年。 勒让德和高斯都采用的方法确定的问题,从天文观测,有关Sun的机构(主要是彗星,但后来也新发现的小行星)的轨道。 1821年,高斯发表最小二乘法理论的进一步发展,在包括高斯-马尔可夫定理的一个版本。

弗朗西斯·高尔顿在十九世纪的“回归”是杜撰来描述一种生物现象。 这种现象是高度高大的祖先的后代往往倒退下来,对一个正常的平均水平(这种现象也被称为向均值回归 )。 对高尔顿,,回归只有这个生物意义,Udny圣诞节和皮尔逊但他的工作,后来扩展到更一般的统计范围内。 在圣诞节和Pearson,工作的响应和解释变量的联合分布被假定为高斯 。 这个假设RA费舍尔在1922年和1925年,他的作品被削弱。费舍尔认为的响应变量的条件分布为高斯分布,但联合分布不一定要。

在这方面,费舍尔的假设是高斯1821年制定的。

在20世纪50年代和20世纪60年代,经济学家旧机电台计算器,计算回归。

1970年以前,有时长达24小时接收从一个回归的结果。

回归方法继续是一个活跃的研究领域。 在最近的几十年中,新的方法已经制定了稳健回归 ,回归涉及的相关反应,如时间序列 曲线和增长曲线 ,回归的预测或响应变量的曲线,图片,图表或其他复杂的数据对象,容纳不同的回归方法丢失的数据, 非参数回归 , 贝叶斯方法进行回归,回归的预测变量的测量误差,预测变量的观测回归,回归和因果关系的推论与类型。

1

理学院 统计系 课程实验论文 第1章 一元线性回归

1.1 指标的选择

影响人口增长的主要因素经济因素,经济因素对人口自然增长的作用主要表现在它决定了人口的增殖条件和生存条件,通过改变人口的出生率和死亡率来影响人口的自然增率。一般情况下,当人口数量不能满足经济发展对劳动力的需求时,人口自身的再生产必将会刺激;当人口数量超越了经济发展所能提供的消费总数后,人口自身的再生产必将受到遏制。在现代生产力水平下,人口的自然增长率往往随着经济水平的提高而下降。经济因素对人口机械增长也有重要影响。通常情况下,经济发达或发展速度较快的地区,对人口具有一种吸引力和凝聚力,人口机械增长为正值;相反,经济落后或经济发展速度缓慢的地区,对人口会产生一种排斥力和离散力,人口机械增长一般为负值。与此同时粮食产量、出生率、死亡率,也是影响人口增长的因素。

符号说明:用x1、x2、x3、x4表示粮食产量、GDP、出生率、死亡率。y表示总人口。

1.2 样本确定

通过查阅中国政府网,得到了1980年到2014年各因素的数据。

表1-1 样本数据

年份 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 2002 2001 2000 1999 1998 1997 1996 粮食产量 (万吨) 60702.61 60193.84 58957.97 57120.85 54647.71 53082.08 52870.92 50160.28 49804.23 48402.19 46946.95 43069.53 45705.75 45263.67 46217.52 50838.58 51229.53 49417.1 50453.5 GDP (亿元) 635910.2 588018.8 534123 484123.5 408903 345629.2 316751.7 268019.4 217656.6 185895.8 160714.4 136564.6 121002 110270.4 99776.3 90187.7 84883.7 79429.5 71572.3 2

出生率(%) 12.37 12.08 12.1 11.93 11.9 11.95 12.14 12.1 12.09 12.4 12.29 12.41 12.86 13.38 14.03 14.64 15.64 16.57 16.98 死亡率(%) 7.16 7.16 7.15 7.14 7.11 7.08 7.06 6.93 6.81 6.51 6.42 6.4 6.41 6.43 6.45 6.46 6.5 6.51 6.56 总人口 (万人) 136782 136072 135404 134735 134091 133450 132802 132129 131448 130756 129988 129227 128453 127627 126743 125786 124761 123626 122389

理学院 统计系 课程实验论文 1995 1994 1993 1992 1991 1990 1989 1988 1987 1986 1985 1984 1983 1982 1981 1980 46661.8 44510.1 45648.8 44265.8 43529.3 44624.3 40754.9 39408.1 40297.7 39151.2 37910.8 40730.5 38727.5 35450 32502 32055.5 61129.8 48459.6 35524.3 27068.3 21895.5 18774.3 17090.3 15101.1 12102.2 10308.8 9039.9 7226.3 5975.6 5333 4898.1 4551.6 17.12 17.7 18.09 18.24 19.68 21.06 21.58 22.37 23.33 22.43 21.04 19.9 20.19 22.28 20.91 18.21 6.57 6.49 6.64 6.64 6.7 6.67 6.54 6.64 6.72 6.86 6.78 6.82 6.9 6.6 6.36 6.34 121121 119850 118517 117171 115823 114333 112704 111026 109300 107507 105851 104357 103008 101654 100072 98705

1.3 一元回归分析

定义1.1 回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。

1.3.1 绘制总人口与粮食产量的散点图

3

理学院 统计系 课程实验论文 图1-1 粮食产量与总人口散点图

1.3.2 设定理论模型

根据图1-1随着粮食产量的增加,总人口的数量增加,且各样本点大致落在一条直线附近,故可以采用公式:

y??0??1x?? (1-1) 一元线性回归理论模型,对数据进行一元回归分析。

1.3.3 回归诊断

表1-1 模型摘要 模型 1 R .909 aR 平方 .826 調整後 R 平方 標準偏斜度錯誤 .821 4985.99669 a. 預測值:(常數),粮食产量(万吨) 根据表1-1模型摘要表可以看到,r?0.909,说明以粮食产量为唯一因变量与总人口的拟合程度很高。

表1-2 系数 非標準化係數 模型 1 (常數) 粮食产量(万吨) a. 應變數\\: 人口(万人) B 53054.404 1.468 標準錯誤 5500.013 .117 .909 標準化係數 Beta T 9.646 12.513 顯著性 .000 .000 根据表1-2系数表,将系数带入公式(1-1)可得出回归模型公式:

??53054.404?1.468x y??142165.8355 用一元回归模型对2014年的总人口进行预测,的到的预测值y

4

理学院 统计系 课程实验论文 第2章 多元线性回归

定义2.1 在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。

2.1 数据中心化标准化

数据中心化和标准化在回归分析中的意义是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。

图2-1 标准化结果

2.2 多元回归模型建立

多元回归模型公式:

y??0??1x1??2x2?...??pxp??

对数据进行多元回归分析,结果如图2.2

表2-1 模型摘要 模型 1 R .972 aR 平方 .944 調整後 R 平方 標準偏斜度錯誤 .936 2967.56830 a. 預測值:(常數),死亡率(%), 出生率(%), 粮食产量(万吨), GDP(亿元)

5

理学院 统计系 课程实验论文 表2-2 變異數分析a 模型 1 迴歸 殘差 總計 平方和 4448849243.984 264193847.616 4713043091.600 df 平均值平方 4 1112212310.996 30 34 8806461.587 F 126.295 顯著性 .000 b a. 應變數: 人口(万人) b. 預測值:(常數),死亡率(%), 出生率(%), 粮食产量(万吨), GDP(亿元)

表2-3 係數 非標準化係數 模型 1 (常數) 粮食产量(万吨) GDP(亿元) 出生率(%) 死亡率(%) a. 應變數\\: 人口(万人) B 124574.667 1.045 -.005 -1460.798 -4060.272 標準錯誤 21501.729 .152 .008 262.207 3649.700 .647 -.078 -.496 -.091 標準化係數 Beta T 5.794 6.893 -.635 -5.571 -1.112 顯著性 .000 .000 .531 .000 .275 a

根据表2-1可知R=0.972,拟合度高,所以能用该模型进行预测,同时模型的检验P值sig<0.05,说明该模型显著可信;根据表2-3得到多远线性回归方程:

??124574.667?1.045x1?0.005x2?1.460.798x3?4060.272x4 y

??138182.2403,与真实值相差同时,根据方程得到14年总人口预测值ye?1400.25403.

2.3 逐步回归法

定义2.2 逐步回归法:逐步回归的基本思想是有进有出。具体做法是将变量一个一个的引入,每引入一个变量后,对已引入变量进行逐个检验,当原引入变量因后引入变量变得不显著时,对其进行剔除,保证最后所得的回归子集是最优回归子集。

根据图2.2可知,变量GDP与死亡率未通过显著性检验,因此采用逐步回归的方法对方程进行优化。

表2-4 逐步回归係數a 非標準化係數 模型 1 (常數) 出生率(%) 2 (常數) B 165146.388 -2687.949 108407.805 標準錯誤 3543.313 210.086 8355.072 -.912 標準化係數 Beta T 46.608 -12.794 12.975 顯著性 .000 .000 .000 6

理学院 统计系 课程实验论文 出生率(%) 粮食产量(万吨) 3 (常數) 出生率(%) 粮食产量(万吨) 死亡率(%) a. 應變數\\: 人口(万人) -1534.270 .816 134678.878 -1366.202 1.012 -5681.557 211.155 .116 14308.542 213.615 .141 2580.897 -.464 .626 -.127 -.521 .505 -7.266 7.052 9.412 -6.396 7.184 -2.201 .000 .000 .000 .000 .000 .035 根据图表2-4,经过逐步回归,剔除了GDP这一变量得到一个拟合度更好的方程:

??134678.878?1012x1?1366.202x3?5681.557x4 y??138506.21662 与真实值相差e?172.21662 同时得到2014年总人口的预测值y对比一般多元回归方法的出的模型预测值与运用了逐步回归后的预测值,发现不用逐步回归的预测值更接近真实值;其原因主要有三方面:

1.我国的人口普查为10年一次,其数据主要也是通过预测的出,所以数据本身存在较大的误差;

2.在实际问题中,自变量之间通常存在相关性,当相关程度严重时称为多重共线性。自变量之间的多重共线性会对回归产生极大的影响;

3.人口预测不适合采用线性多元回归的方法进行预测。

2.4 多重共线性

定义2.3 多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

多重共线性产生原因:

(1)经济变量相关的共同趋势; (2)滞后变量的引入; (3)样本资料的限制。 影响:

(1)完全共线性下参数估计量不存在;

(2)近似共线性下OLS估计量非有效,多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)如果方差膨胀因子值越大,说明共线性越强。相反 因为,容许度是方差膨胀因子的倒数,所以,容许度越小,共线性越强。可以这样记忆:容许度代表容许,也就是许可,如果,值越小,代表在数值上越不容许,就是越小,越不要。而共线性是一个负面指标,在分析中都是不希望它出现,将共线性和容许度联系在一起,容许度越小,越不要,实际情况越不好,共线性这个“坏蛋”越强。进一步,方差膨胀因子因为是容许度倒数,所以反过来;

(3)参数估计量经济含义不合理;

7

理学院 统计系 课程实验论文 (4)变量的显著性检验失去意义,可能将重要的解释变量排除在模型之外; (5)模型的预测功能失效。变大的方差容易使区间预测的“区间”变大,使预测失去意义。

2.3.1 多重共线性检测

用SPSS 22.0对数据进行多重共线性检测

表2-5 共線性診斷 變異數比例 模型 1 維度 1 2 2 1 2 3 3 1 2 3 4 特徵值 1.972 .028 2.929 .068 .003 3.927 .070 .003 .001 條件指數 1.000 8.447 1.000 6.557 33.798 1.000 7.506 36.436 86.828 (常數) .01 .99 .00 .00 1.00 .00 .00 .15 .85 出生率(%) 粮食产量(万吨) 死亡率(%) .01 .99 .00 .18 .81 .00 .17 .79 .04 a .00 .06 .94 .00 .03 .74 .24 .00 .00 .03 .97 a. 應變數: 人口(万人) 检测结果表2-5显示: (1)特征值有3个接近0,表明存在多重共线性; (2)条件指数有3个>10,表明可能存在多重共线性;

(3)在相关系数矩阵中,死亡率数值接近1可能存在多重共线性;

表2-6 排除共线性变量后的係數 非標準化係數 模型 1 (常數) 出生率(%) 2 (常數) 出生率(%) 粮食产量(万吨) 3 (常數) 出生率(%) 粮食产量(万吨) 死亡率(%) a. 應變數\\: 人口(万人) B 165146.388 -2687.949 108407.805 -1534.270 .816 134678.878 -1366.202 1.012 -5681.557 標準錯誤 3543.313 210.086 8355.072 211.155 .116 14308.542 213.615 .141 2580.897 -.464 .626 -.127 -.521 .505 -.912 標準化係數 Beta T 46.608 -12.794 12.975 -7.266 7.052 9.412 -6.396 7.184 -2.201 顯著性 .000 .000 .000 .000 .000 .000 .000 .000 .035 共線性統計資料 允差 VIF a 1.000 1.000 .400 .400 2.502 2.502 .349 .241 .553 2.868 4.146 1.808 根据表2-6,剔除GDP这一变量后,其余变量的VIF全部小于10,排除变量间存在多重共线性的原因,不需要再次剔除变量。得到剔除共线性后的多元线性回归方

8

理学院 统计系 课程实验论文 ??134678.878?1.012x1?1366.202x3?5681.557x4 程:y2.4 主成分分析

定义2.4 主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。

在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。

主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。主成分分析的主要原理是寻找一个适当的线性变换:

(1)将彼此相关的变量转变为彼此独立的新变量;

(2)方差较大的几个新变量就能综合反应原多个变量所包含的主要信息; (3)新变量各自带有独特的专业含义。 住成分分析的作用是: (1)减少指标变量的个数; (2)决多重相关性问题

2.4.1 主成分分析模型建立

运用SPSS 22.0对数据进行主成分分析

表2-7 各变量所占权重 起始特徵值 元件 1 2 3 4 總計 3.040 .727 .152 .081 變異的 % 76.004 18.176 3.793 2.028 累加 % 76.004 94.179 97.972 100.000 總計 3.040 擷取平方和載入 變異的 % 76.004 累加 % 76.004 擷取方法:主體元件分析。 根据主成分分析结果可以看出前两个变量所占比重最多,二者的和所占比例为94.18%,所以可以采用前两个变量建立回归模型。

表2-8 回归係數 非標準化係數 模型 1 (常數) 粮食产量(万吨) GDP(亿元) B 53075.711 1.468 2.494E-5 標準錯誤 9733.191 .235 .009 .908 .000 標準化係數 Beta T 5.453 6.252 .003 顯著性 .000 .000 .998 a9

理学院 统计系 课程实验论文 a. 應變數\\: 人口(万人)

根据表2-8,得到回归方程:

??53075.711?1.468x1?2.494*10?5x2y

??142180.52727万人。 根据回归方程预测出2014年人口y因为:

1.主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。

2.主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。因此,提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”。

所以预测的结果出现了更大的误差

10

理学院 统计系 课程实验论文 第3章 非线性模型

3.1 曲线回归

定义3.1 非线性回归是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当研究的因果关系涉及因变量和两个或两个以上自变量时,叫做多元回归分析。

确定两个变数间数量变化的某种特定的规则或规律;估计表示该种曲线关系特点的一些重要参数,如回归参数、极大值、极小值和渐近值等;为生产预测或试验控制进行内插,或在论据充足时作出理论上的外推。

3.1.1 曲线拟合

对国内总人口的拟合,选取总人口指标为因变量,单位为万人,拟合总人口关于时间t的趋势曲线。以1980年为基准年,取值为t?1,2014年t?35。

绘制总人口与变量t的散点图,如图3-1所示。

图3-1 总人口对t的散点图

从散点图可以看到,总人口大致符合三次函数形式,当人口的增长速度大致相同时,其趋势线就是三次函数形式。

11

理学院 统计系 课程实验论文

图3-2 拟合曲线图

通过观察图3-2,发现三次曲线模型拟合度最好,其次为线性和复合模型,故根据公式:

23y?b0?bt1?b2t?b3t

建立三次曲线模型。

表3-1 模型摘要 R 1.000 自變數為 时间。 R 平方 .999 調整後 R 平方 標準偏斜度錯誤 .999 365.498

表3-2 變異數分析 迴歸 殘差 總計 平方和 4708901835.390 4141256.210 4713043091.600 df 平均值平方 3 1569633945.130 31 34 133588.910 F 11749.732 顯著性 .000 自變數為 时间。

表3-3 三次曲线系数 非標準化係數 標準化係數 Beta 1.609 -.571 -.076 T 28.230 -4.214 -.908 348.004 顯著性 .000 .000 .371 .000 时间 时间 ** 2 时间 ** 3 (常數) B 1849.094 -17.683 -.070 96103.588 標準錯誤 65.501 4.196 .077 276.157

根据图表3-1,得到三次函数模型的R?1.000,说明拟合程度非常好;同时

12

理学院 统计系 课程实验论文 根据表3-2可知,方程整体都通过了显著性检验;根据表3-3可知,不但方程整体通过了显著性检验,每个不同次幂的t也经过了显著性检验,所以建立的三次方程式完全符合实际情况的。

根据第三个表建立出三次函数方程:

??1849.094t?17.683t2?0.077t3 y??136174.94841万人,预测值与真实值相差同时得出2014年预测值ye?607.0516万人。

预测值与真实值相差程度远小于运用线性多元回归方法、逐步回归法和主成分分析后的预测值与真实值之间的差异,进一步证明建立的三次函数模型符合实际情况。

3.2 Logistic模型

Logistic模型增长公式为:

pt?pm(1?ea?bt)

其中pt为时刻的人口总数,pm为人口极限规模,e为自然对数的底,t为时刻长度,a、b为待定参数。

Logistic模型考虑到人口总数增长的有限性,提出了人口总数增长的规律即随着人口总数的增长,人口增长率逐渐下降,但对于在短期内如30-50年内人口增长可能呈上升趋势如人口生育率上升、死亡率下降等原因而导致人口呈上升趋势。Logistic模型在应用中对时间长,人口数据变化大,因此误差较大且不稳定。而小城镇人口的变化就存在人口数据变化较大的特点,所以Logistic模型对小城镇人口的预测并不适合。

用对人口进行Logistic曲线拟合,运用命令:

x=[2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 2002 2001 2000 1999 1998 1997 1996 1995 1994 1993 1992 1991 1990 1989 1988 1987 1986 1985 1984 1983 1982 1981 1980]

y=[136782 136072 135404 134735 134091 133450 132802 132129 131448 130756 129988 129227 128453 127627 126743 125786 124761 123626 122389 121121 119850 118517 117171 115823 114333 112704 111026 109300 107507 105851 104357 103008 101654 100072 98705]

x=x';y=y';

st_ = [2000 127627 1];(在x,y内任意取的数) ft_ = fittype('a/(1+b*exp(-k*(x-1980)))' ,... 'dependent',{'y'},'independent',{'x'},...

13

理学院 统计系 课程实验论文 'coefficients',{'a', 'b', 'k'}); cf_ = fit(x,y,ft_ ,'Startpoint',st_) 最后运行出的结果: cf_ =

General model:

cf_(x) = a/(1+b*exp(-k*(x-1980))) Coefficients (with 95% confidence bounds): a = 1.217e+005 (1.144e+005, 1.29e+005) b = 1.176e+005 (-4.741e+009, 4.742e+009) k = 13.21 (-4.032e+004, 4.035e+004) 根据运行结果,得到Logistic拟合方程:

??y1.217e?005

1?1.176e?005*exp(?13.21*(x?1980))

其中a为人口上线的估计值,因为在1995年人口的实际值就已经超过了预测上限,所以该模型不是和用于预测未来的人口。造成模型不准确的原因主要是数据过少,且人口数据多数来自抽样调查,数据本身存在一定误差。

14

理学院 统计系 课程实验论文 结 论

通过不同的模型建立方法对获得的人口数据建立了多个不同的预测模型;经过对比发现三次曲线模型是最符合实际运用的;导致其他模型不适用的原因主要为: (1)目前我国的人口出生率低、死亡率低、自然增长率低.这表明我国将进入“低、低、低”现代人口再生产类型的行列;即我国今后的人口数量趋势大致会成为一条水平线。

(2)自20世纪70年代初期大力推行计划生育政策以来,中国人口过快增长的势头得到了有效遏制.由于中国人口基数大,青少年的比重较高,在今后一段较长的时期内,人口总量还将持续增长,在经历高峰期后,人口总数才会呈缓慢下降的趋势;本次分析采用的数据为1980年到2014年,数据受到政策影响较大。

通过对模型趋势线的观测,发现在未来一段的时间内我国的人口都将处于缓慢增加的状态,到2025左右年会达到峰值。

15

理学院 统计系 课程实验论文 参考文献

[1]宋佩锋. 人口预测方法比较研究[D].安徽大学,2013.

[2]李朝旗,周兴. 土地利用规划中的人口预测方法综述[J]. 国土资源科技管理,2006,02:64-69.

[3]王越,尚长春,郭召,唐年胜,赵慧. 云南省人口老龄化预测及其实证分析[A]. 中国统计教育学会.2015年(第四届)全国大学生统计建模大赛论文[C].中国统计教育学会:,2015:24.

[4]李强,张震,吴瑞君. 概率预测方法在小区域人口预测中的应用——以上海市青浦区为例[J]. 中国人口科学,2015,01:79-88+127-128.

[5]杜悦凡. 小城镇总体规划中人口预测方法研究[D].合肥工业大学,2014. [6]汤江龙. 土地利用规划人工神经网络模型构建及应用研究[D].南京农业大学,2006.

[7]侯银莉. 湖南省人口数量及结构的预测研究[D].中南大学,2010. [8]蒋赛. 黑龙江省人口数量与结构的预测研究[D].哈尔滨工业大学,2013. [9]韩玉涛. 中国人口预测的半参数模型[D].河南科技大学,2011.

[10]刘云刚,王丰龙. 快速城市化过程中的城市建设用地规模预测方法[J]. 地理研究,2011,07:1187-1197.

[11]王硕. 基于流域尺度的可持续复合水生态承载力研究[D].大连理工大学,2014. [12]陈昉源. 湖北省人口中长期变化趋势灰色组合模型预测研究[D].华中农业大学,2006.

[13]李传新. 城市总体规划中人口预测方法的应用[D].内蒙古师范大学,2011. [14]姜英霞. 中国城镇职工社会养老保险基金未来收支缺口的精算预测[D].山东财经大学,2013.

[15]苑亚坤. 区域经济发展与人口流动关系的实证模型研究[D].天津财经大学,2013.

[16]王学义,曾祥旭. 对我国近年来人口预测研究的述评[J]. 理论与改革,2007,06:157-160.

[17]王楠. 区域视角下城市人口规模预测方法研究[D].西安建筑科技大学,2011. [18]李宏伟. 基于GIS的人口信息管理系统研究[D].江西理工大学,2010. [19]陈斌. 福建省人口构成动态仿真及分析[D].福建农林大学,2006.

[20]余志飞. 基于GIS与BP神经网络的人口预测与信息管理系统开发研究[D].江西理工大学,2015.

16

理学院 统计系 课程实验论文

17

本文来源:https://www.bwwdw.com/article/9o1w.html

Top