co对吸烟的危害数学建模论文 - 图文

更新时间:2024-01-08 08:10:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

摘要

众所周知,吸烟不仅危害自身健康,而且由此引起的被动吸烟更是危害公众身心健康的主要原因。为此,如何帮助相关人士摆脱烟瘾的困扰也就成为一个重要的研究课题。本文对题中所给数据进行深入细致的处理和分析,利用EXCEL作图,MATLAB拟合和SPSS相关性检验建立数学模型,探寻影响戒烟成功的主要因素,并在最后根据本文的相关研究结果对广大有志于戒烟的烟民提出了几条科学合理的建议。

针对问题一,为了能够直观的看出再次吸烟者的累加发病率的分布情况,利用数理统计分析知识和EXCEL知识对各影响因素的调查数据进行的筛选、分组和数值统计,采用控制变量法分别对性别,年龄,每日抽烟支数,CO浓度和调整CO浓度分别进行分析,用数理统计知识进行分组、统计,整理出再次吸烟者累加发病率条形分布图,即得到再次吸烟者的累加发病率分布情况。

针对问题二,考虑到要定量分析年龄、性别、每日抽烟支数及调整的CO浓度等因素会影响戒烟时间即天数的长短。首先用EXCEL进行数据筛选,删掉缺失的数据,其次,对224名戒烟时间一样的研究对象的不同影响因素的数据求均值,建立统计回归模型,并结合MATLAB统计工具进行多次去点拟合,得到回归系数,用多重判断系数R2评价模型拟合的优度,用检验统计量F、p等判断自变量对因变量的影响是否显著,最后,用SPSS的Pearson 相关性检验,找出可靠性较高的模型,用控制变量法对线性回归模型进行定量分析,得出关系式为:

2 d?207.3730?1.6518x1?16.3477x3?0.1984x4?0.0842x5?0.3402x3针对问题三,在问题二分析的基础上可知戒烟是否成功可用戒烟时间的长短

来刻画,则戒烟成功的因素有研究对象的每日抽烟支数、CO浓度及调整的CO浓度,建立多元线性统计回归模型,并结合MATLAB统计工具进行统计回归分析,经过多次去点拟合,

得到回归系数,进一步写成回归方程,经过可靠性分析,即可得出影响戒烟成功的主要因素为每日抽烟支数。

针对问题四,根据一、二、三的分析结果,得到影响戒烟成功的主要因素,根据这些因素对戒烟者提出了合理的建议。

关键词: 统计回归模型 数理统计 MATLAB去点拟合 相关性分析

一、问题重述

众所周知,吸烟不仅危害自身健康,而且由此引起的被动吸烟更是危害公众身心健康的主要原因。为此,如何帮助相关人士摆脱烟瘾的困扰也就成为一个重要的研究课题。

本文研究数据涉及 234人,他们都自愿表示戒烟但还未戒烟。在他们戒烟的这一天,测量了每个人的CO(一氧化碳)水平并记下他们抽最后一支烟到CO测定时间.。 CO的水平提供了一个他们先前抽烟数量的客观指标,但其值也受到抽最后一支烟的时间的影响, 因此抽最后一支烟的时间可以用来调整CO的水平。记录下研究对象的性别、年龄及自述每日抽烟支数。这个调查跟踪1年, 考察他们一直保持戒烟的天数, 由此估计这些人中再次吸烟的累加发病率, 也就是原吸烟者戒烟一段时间后又再吸烟的比例. 其中假设原烟民戒烟的可信度是很低的(更恰当地说多数是再犯者)戒烟天数是从0到他(她)退出戒烟或研究截止时间(1 年)的天数。假定他们全部没有人中途退出研究。 请回答下列问题:

1)试分析上述234人中再次吸烟的累加发病率分布情况(如不同年龄段、不同性别等因素下的累加发病率分布情况)。 2)你认为年龄、性别、每日抽烟支数及调整的CO浓度等因素会影响戒烟时间(天数)长短吗?如果影响请利用附录中的数据,分别给出戒烟时间与上述你认为有影响的因素之间的定量分析结果。

3)请利用附录中的数据建立适当的数学模型,讨论影响戒烟成功的主要因素有哪些,并对你的模型进行可靠性分析。

4)请根据你的模型,撰写一篇500字左右的短文,向有志于戒烟的人士提供戒烟对策和建议。

二、问题分析

2.1问题一的分析

首先,我们先分析数据,发现有数据不全的被调查者,利用EXCEL将数据不全的被调查者删除,从234个被调查者中共去除了10个数据不全的。然后对剩余的224个被调查者进行分析,为了能够直观的看出再次吸烟的累加发病率的分布情况,我们采用控制变量法分别对性别,年龄和每日抽烟支数进行分析,用数理统计知识进行分组、统计,整理出累加发病率分布表,并作出条形图能够更加直观反映,根据条形图可以分析出224人中再次吸烟的累加发病率的分布情况。 2.2问题二的分析

考虑到要定量分析年龄、性别、每日抽烟支数及调整的CO浓度等因素是否

会影响戒烟时间即天数的长短,首先用EXCEL进行数据筛选,删掉缺失的数据,然后对224名戒烟时间一样的研究对象的不同影响因素的数据求平均值。最后建立统计回归模型,利用MATLAB统计工具进行统计回归分析,经过多次去点拟合,得到回归系数、置信区间(a=0.05)以及检验统计量R2、F、p的值,并用SPSS 中的Pearson 相关性检验综合分析戒烟时间与其影响的各因素之间的关系。 2.3问题三的分析

由问题二的分析可知:戒烟时间的长短与研究对象的年龄、研究对象每日抽烟支数、CO浓度及调整的CO浓度有关。而此问题又考虑到戒烟是否成功的主要因素,那么戒烟是否成功可用戒烟时间的长短来衡量,假设戒烟是否成功与每日抽烟支数,CO浓度及调整CO浓度有关,在问题二给出的统计回归模型上稍加修改,利用MATLAB统计工具进行统计回归分析,经过多次去点拟合,得到回归系数、置信区间(a=0.05)以及检验统计量R2、F、p的值,进行相关性分析,得出影响戒烟成功的主要因素。 2.4问题四的分析

吸烟者戒烟成功通常需要两个条件,一是戒烟的动机,二是戒烟的技能和帮

助。根据前面对问题一、二、三的讨论分析结果,题出对有志于戒烟的人士的合理戒烟建议。

三、模型假设与符号说明

3.1基本假设

1)假设原烟民戒烟的可信度是很低的。

2)假设数据中的缺失值的忽略对总体信息不会有显著影响。 3)假设数据都是可靠的,不包括人为造成的不合理因素。 4)本题涉及的234人是从愿意戒烟人群中随机抽取的。

5)凡是戒烟天数没有达到365天的调查者都算是再次吸烟人群。 6)假设在调查期间没有人员的伤亡等因素而造成影响。 7)假设在此期间没有人员退出研究。 3.2符号说明

x1:研究对象的年龄。

x2:研究对象的性别。

x3:研究对象每日抽烟支数。 x4:CO浓度。

x5:调整的CO浓度。 an:回归系数(0?n?8)。

d:戒烟天数。 ?:随机误差。

四、模型建立与求解

4.1问题(一):乘车费用与乘车时间的关系 4.1.1模型建立

对题中数据分析之后,从234个调查者中共去除了10个数据不全的。然后对剩余的224个调查者进行分析,为了能够直观的看出再次吸烟的累加发病率的分布情况,我们采用控制变量法分别对性别,年龄,每日抽烟支数和CO浓度进行分析,用数理统计知识进行分组、统计,整理出累加发病率分布表,并利用EXCEL软件作出条形图能够更加直观反映,根据条形图可以分析出224人中再次吸烟的累加发病率的分布情况。 4.1.2模型求解 4.1.2.1性别因素分析

首先,利用数理统计知识对性别因素进行分析,整理得出累加发病率的分布表如表1.1。

表1.1男女的累加发病率分布表 性别 总人数 戒烟成功人数 戒烟失败人数 累加发病率 104 16 87 38.84% 男 120 14 106 47.32% 女 利用EXCEL软件作出男女的累加发病率的条形图如图1.1。 男女的累加发病率条形图50.00E.00@.005.000.00%.00 .00.00.00%5.00%0.00%男性别女累加发病率累加发病率

图1.1男女的累加发病率的条形图

由条形图可知,男性与女性的累加发病率基本相同,但是女性的累加发病率要稍大于男性的。 4.1.2.2年龄因素分析

利用数理统计知识对年龄因素进行分析,整理得出累加发病率的分布表如表1.2。

表1.2不同年龄段的累加发病率分布表 年龄 人数 戒烟成功人数 戒烟失败人数 累加发病率 20-30 51 6 45 20.09% 31-40 57 7 50 22.32% 41-50 56 8 48 21.43% 51-60 39 4 35 15.63% 61-70 16 5 11 4.91% 71-80 5 1 4 1.79% 利用EXCEL软件作出不同年龄段的累加发病率的条形图如图1.2。 不同年龄段的累加发病率条形图25.00 .00%发病率15.00%累加发病率10.00%5.00%0.00 -3031-4041-50年龄51-6061-7071-80

图1.2不同年龄段的累加发病率的条形图

根据条形图可以判断出,累积发病率在31-40岁最高,在40岁之后,随着年龄的增长,累积发病率在逐渐减小。在70岁之后累加发病率明显减小,可能是因为调查人数比较少,基数小。 4.1.2.3每日抽烟支数因素分析

利用数理统计知识对每日抽烟支数因素进行分析,整理得出累加发病率的分布表如表1.3。

表1.3不同每日抽烟支数因素下累加发病率 每日抽烟支数 总人数 戒烟成功人数 戒烟失败人数 累加发病率 0-10 26 4 22 9.82% 11-20 77 8 69 30.80% 21-30 69 12 57 25.45%

31-40 41-50 50-100 36 8 8 4 1 2 32 7 6 14.29% 3.13% 2.68% 利用EXCEL软件作出不同每日抽烟支数因素下累加发病率条形图如图1.3。 累加发病率35.000.00%累加发病率25.00 .00.00.00%5.00%0.00%0-1011-2021-3031-40抽烟支数41-5050-100累加发病率

图1.3不同每日抽烟支数因素下累加发病率条形图

由图表分析可知,每日抽烟支数在11-20支的时候,累加发病率最大,在大于50 的时候累加发病率是最低的。在每日抽烟支数超过10支得时候,随着抽烟支数的增加,累加发病率逐渐减小,这其中的原因是每天抽烟支数多的人群所占的比例很少,所以累加发病率也会小。 4.1.2.4 CO浓度数因素分析

利用数理统计知识对CO浓度数因素因素进行分析,整理得出累加发病率的分布表如表1.4。

表1.4不同CO浓度时的累加发病率 CO浓度区间 总人数 戒烟成功人数 戒烟失败人数 累加发病率 0-200 86 15 71 31.70% 201-400 105 13 92 41.07% 401-600 31 3 28 12.50% 601-800 1 0 1 0.45% 801-1000 1 0 1 0.45% 利用EXCEL软件作出不同CO浓度因素下累加发病率条形图如图1.5。

累加发病率45.00@.005.00%累加发病率30.00%.00 .00.00.00%5.00%0.00%0-200201-400401-600CO浓度区间601-800801-1000累加发病率

图1.5不同CO浓度因素下累加发病率条形图

根据图表可得出,CO浓度在201-400的时候,累加发病率最大,在CO浓度超过400时,随着CO浓度的增加,累加发病率在逐渐减小。在CO浓度超过600之后,累加发病率极低,是因为浓度超过600的人数极少。 4.1.2.4 调整CO浓度数因素分析

利用数理统计知识对LogCOadj浓度数因素因素进行分析,整理得出累加发病率的分布表如表1.6。

表1.6不同LogCOadj浓度时的累加发病率 LogCOadj浓度区间 0-1000 1000-1200 1200-1400 1400-1600 1600-1800 1800-2000 总人数 11 19 70 92 30 2 戒烟成功人数 3 2 9 14 3 0 戒烟失败人数 8 17 61 78 27 2 累加发病率 3.57% 7.59% 27.23% 34.82% 12.05% 0.89% 利用EXCEL软件作出不同LogCOadj浓度因素下累加发病率条形图如图1.6。

累加发病率40.005.000.00%.00 .00.00.00%5.00%0.00%累加发病率累加发病率0-10001000-12001200-14001400-16001600-1800LogCOadj浓度区间

图1.6不同LogCOadj浓度因素下累加发病率条形图

上图则是不同调整CO浓度情况下的累加发病率,由图可以看出在(1400-1600)这个区间的时候累加发病率最大,在大于1800的时候累加发病率最低,在调整浓度在大于1400的时候,随着浓度的增大,累加发病率在逐渐减小。

4.2问题(二):

4.2.1 模型建立

首先用Excel进行数据处理,删掉缺失的数据,得到的224组数据,然后对224名戒烟时间一样的研究对象的不同影响因素的数据求平均值得到的数据(见附录一)。

由于题中要求定量分析,所以建立多元线性回归分析模型。用相关系数R评

F统计量和概率值p来检验自变量对因变量的影响价回归方程拟合优度的度量,

2是否显著。

假设影响戒烟时间的各个因素之间互不影响,且相互独立,并且与戒烟时间呈线性相关,则建立一元线性回归方程的数学模型为:

d?a0?a1?x1?a2?x2?a3?x3?a4?x4?a5?x5??

其中a0、a1、a2、a3、a4、a5是待估计的回归系数,?是随机误差。由上表的数据估计,影响d的其他因素都包含在随机误差?中,若模型选择的合适,那么?应大致服从均值为0的正态分布。

1800-2000

4.2.2模型求解

直接利用MATLAB统计工具箱中的regress命令求解(程序见附录二),得到回归系数以及置信区间(置信水平为0.05)、检验统计量R、F、p、s的结

22果如表2.1。

参数 表2.1模型一的计算结果 参数估计值 置信区间 -113.9430 -0.2086 38.8912 1.8081 -0.4936 0.1566 [-433.1318 ,205.2459] [-2.5226 , 2.1054] [-19.9661 , 97.7484] [-0.4674 , 4.0836] [-0.7694 , -0.2178] [-0.0529 ,0.3662] a0 a1 a2 a3 a4 a5 R2=0.20937 F=3.1779 p< 0.01305 s2=7498.3 由上表显示,R2=0.20937指因变量戒烟天数d的20.937%可由模型确定,而

F的值相对p来说较小,拟合程度较低,显著性不高。因此需要做进一步的改进。

4.2.3模型改进

上述模型是我们假设各个变量之间没有交互作用实现的,但是模型结果显示

拟合程度不高,所以各个变量之间应该有一些交互作用,因此我们用SPSS双因素相关性分析,分析各个因素之间的相关性,分析结果如表2.2。

表2.2相关性分析 相关性 Pearson 相关性 年龄 显著性(双侧) N Pearson 相关性 显著性(双侧) 年龄 性别 *每日抽烟支数 .115 .111 193 -.018 .805 CO浓度 距…分钟 -.110 .126 193 .120 .095 调整CO浓度 -.089 .218 193 -.097 .181 戒烟天数 -.062 .391 193 .094 .193 1 -.166 .021 193 1 -.052 .476 193 -.085 .241 193 -.166 .021 *性别

N 每日抽烟支数 Pearson 相关性 显著性(双侧) N Pearson 相关性 CO浓度 显著性(双侧) N 距…分钟 Pearson 相关性 显著性(双侧) N Pearson 相关性 显著性(双侧) N Pearson 相关性 显著性(双侧) N 193 .115 .111 193 -.052 .476 193 -.110 .126 193 -.089 .218 193 -.062 .391 193 193 -.018 .805 193 -.085 .241 193 .120 .095 193 -.097 .181 193 .094 .193 193 193 1 193 .408 .000 193 1 **193 -.182 .011 193 -.503 .000 193 1 ***193 .390 .000 193 .809 .000 193 -.031 .672 193 1 ****193 -.054 .454 193 -.266 .000 193 .342 .000 193 -.107 .138 193 1 **** 193 .408 .000 193 -.182 .011 193 .390 .000 193 -.054 .454 193 ***** 193 -.503 .000 193 .809 .000 193 -.266 .000 193 ****** 193 -.031 .672 193 .342 .000 193 **调整CO浓度 193 -.107 .138 193 戒烟天数 193 *. 在 0.05 水平(双侧)上显著相关。 **. 在 .01 水平(双侧)上显著相关。 从表中可以观察到,年龄、性别与每日抽烟支数的相关性较大,而且根据常识,他们之间有交互项,则得到新模型为:

2d?a0?a1?x1?a2?x2?a3?x3?a4?x4?a5?x5?a6?x3?a7?x1?x3?a8?x2?x3??其中a0、a1、a2、a3、a4、a5、a6、a7、a8是待估计的回归系数,? 是随机误差。利用MATLAB工具进行多次去点拟合(程序见附录三),去点拟合过程中采用残差分析方法,用rcoplot命令绘制残差图,以第一次建立的线性回归模型为例做出残差图进行分析:

Residual Case Order Plot400300200Residuals1000-100-200-3000102030405060Case Number图2.1残差分析图

从图中可以看出除倒数第一二个数据及第八个数据外,其余残差离零点较近,并且残差的置信区间都包含零点,说明模型中的这些数据能较好的模拟原始数据,是可用的。而图中虚线部分数据可视为异常数据,可予以剔除后重新计算线性回归系数。如此下去,进行多次去点拟合,初步得到了回归系数、置信区间(置信度为0.05)以及检验统计量R2、F、p的结果如表2.3。

参数 表2.3模型二的计算结果 参数估计值 置信区间 331.6641 -3.4897 -32.5197 -21.8294 -0.1556 0.0790 0.2994 [133.8402 ,529.4880] [-6.2657, -0.7137] [-96.3985 ,31.3592] [-30.0721 ,-13.5868] [-0.2607, -0.0506] [0.0143, 0.1436] [0.2335 ,0.3653]

a0 a1 a2 a3 a4 a5 a6

a7 a8 0.1035 1.5716 [-0.0173, 0.2242] [-0.8856, 4.0289] R2=0.8333 F=23.7396 p=0.0000 s2=562.9625 由表2.4可知,模型二的R2和F都比模型一有所改进,R2=83.33%即因变量戒烟时间的83.33%可由该模型确定,F?23.7393也远远大于p,总体来说该模型可以,但不足的是回归系数a2、a7、a8的置信区间包含了零点,至此,需要对模型进行进一步的改进。所以我们对x1、x2、x3的交互项及x2项去掉,改成以下模型:

2d?a0?a1?x1?a3?x3?a4?x4?a5?x5?a6?x3??

其中a0、a1、a3、a4、a5、a6是待估计的回归系数,? 是随机误差。利用MATLAB工具进行多次去点拟合(程序见附录四),得到以下回归系数及置信区间(a=0.05),以及检验统计量R2、F、p的结果如表2.4。

参数 表2.4模型三的计算结果 参数估计值 置信区间 207.3730 -1.6518 -16.3477 -0.1984 0.0842 0.3402 164.6181 250.1278 -2.0617 -1.2419 -17.8276 -14.8677 -0.2435 -0.1532 0.0563 0.1120 0.3145 0.3658 a0 a1 a3 a4 a5 a6 R2= 0.9719 F= 207.5490 p=0.0000 s2=91.3109 模型三比上述两模型都有所改进,并且所有的回归系数的置信区间都不含零点,检验统计量显示R2=97.19%,即因变量戒烟时间的97.19%可由该模型确定,

F?207.5490也远远大于p,则该模型完全可用。从模型中得出该模型的关系式

为:

2 d?207.3730?1.6518x1?16.3477x3?0.1984x4?0.0842x5?0.3402x3模型中各个回归系数的含义可有如下解释:x1说明每增加一岁,则戒烟时间减少1.6518天;x3说明每天多抽一支烟,则戒烟时间减少16.3477天;x4说明CO的浓度每增加一个单位,则戒烟时间减少0.1984天;x5说明调整CO的浓度每增加一个单位,戒烟时间增加0.0842天。

综上所述,戒烟时间的长短与研究对象的年龄、研究对象每日抽烟支数、CO浓度及调整的CO浓度有关,这些因素对戒烟时间的影响关系式如下:

2 d?207.3730?1.6518x1?16.3477x3?0.1984x4?0.0842x5?0.3402x34.3问题(三): 4.3.1模型建立

根据问题二的分析可得:戒烟时间的长短与研究对象的年龄、研究对象每日

抽烟支数、CO浓度及调整的CO浓度有关。而考虑到戒烟是否成功是由戒烟时间的长短来衡量,那么现在假设戒烟是否成功与每日抽烟支数,CO浓度及调整CO浓度有关,则建立的模型关系式可写为:

2 d?a0?a3?x3?a4?x4?a5?x5?a6?x3??

其中a0、a3、a4、a5是回归系数,?是随机误差。 4.3.2模型求解

利用MATLAB统计工具进行统计回归分析(程序见附录五),经过多次去点拟合,即可得到回归系数、置信区间(a=0.05)以及检验统计量R、F、p的结

2果如表3.1。

参数 表3.1模型四的计算结果 参数估计值 244.3819 -18.8638 -0.0603 0.0205 0.3621 置信区间 a0 a3 a4 [169.1628, 319.6010] [-21.0896, -16.6381] [-0.1487, 0.0281] [-0.0379, 0.0789] [0.3246 ,0.3996] a5 a6

R2=0.9401 F=125.6228 p=0.0000 s2=180.4712 从多次去点拟合的结果来看,R2=94.01%说明因变量即戒烟时间的94.01%可由该模型来确定,F=125.6228远远大于p,因此,该模型是可以用的,从拟合中可以得到关系式为:

2d?244.3819?18.8638x3?0.0603x4?0.0205x5?0.3621x3

4.3.3可靠性分析

从上式可以看出,x3即研究对象每日抽烟支数每增加一根,戒烟天数减少18.8639天,那么戒烟成功率(戒烟天数与一年总天数之比)就要变低;x4即CO浓度每增加一个单位戒烟天数减少0.0603天,戒烟成功率也要降低;x5调整的CO浓度每增加一个单位,戒烟天数就要增加0.0205天,那么戒烟成功率也随之升高。综上,影响戒烟成功的因素有研究对象每日抽烟支数、CO浓度、调整的CO浓度,而影响最大的为每日抽烟支数。 4.4问题(四):给戒烟者的建议

吸烟有害健康,烟草使用已经成为健康的最重要杀手,戒烟作为减少烟草使用的最直接方法已经成为控烟的首要任务。因此研究提高戒烟成功率的影响因素,对于推动烟草的控制十分有利。

结合一、二、三问的具体数据分析和模型分析,可以发现不同性别,不同年龄段的戒烟者的累加发病率和戒烟天数虽然有差别,但是差别并不是很大。而每天抽烟支数和CO浓度和戒烟者的累加发病率的关系相对来说比较明显,由此可知,烟龄越长,抽烟量越大的戒烟者累加发病率越高,越不容易戒烟。据此我们对戒烟者提出以下几点建议:

(1)不论是男性还是女性,也不论年龄的大小,支要下定决心就可以戒烟成功,不能认为自己年纪大了就不能戒烟。

(2)每日抽烟支数对戒烟成功的影响较大,戒烟者先前每日抽烟的支数越多,戒烟天数可能越短,戒烟成功就越困难,所以要想戒烟首先应该有坚强的毅力,尽量减少自己每日的抽烟支数。

(3)CO浓度可反映出戒烟者的烟龄大小,烟龄越大的人越不容易戒烟,戒烟者必须要克服困难,有坚强的意志,逐渐减少自己的抽烟次数和数量。

最后,戒烟是一项艰巨而长远的工作,戒烟者应该相信自己,不论年龄和性别,只要有决心,有坚强的毅力,就一定能把烟瘾彻底戒掉。

六、模型的评价与推广

6.1 模型的优点

1)构建模型时,对数据进行了仔细的分析处理。从原始数据得到的结果不断分类筛选,体现了思维的严谨性,灵活性,也增加了模型的科学性。

2)数据处理及模型求解时充分利用了EXCEL以及MATLAB等的数学软件,较好地解决了问题,得到了较理想的结果。充分利用了题目中的各种信息,并且较好地对模型结果进行了分析。

3)模型建立与求解过程中灵活地运用图表,使得模型更加清晰、明了、易懂,增强了文章的可读性,便于读者理解。

4)用Excel进行数据处理,删掉缺失的数据,运用相同项求均值,是运算拟合更加简单。

5) 将二次回归模型转化为线性回归模型处理,降低了模型的复杂度。 6.2模型的缺点

1)把仅给出的234人作为被调查者,调查数据可能不足以精确说明234人中再次吸烟的累加发病率地分布情况。

2)用Excel进行数据处理,删掉缺失的数据,运用相同项求均值,只能反映整体情况,可能造成数据丢失。

3)运用MATLAB进行去点拟合时,丢失大量数据,存在一定的误差。 6.3模型的推广

总之,模型具有一定的一般性,便于进一步推广,建立的数学模型与实际

情况无太大出入,具有一定的指导性。我们对数据进行预处理,运用EXCEL整理数据绘制图表同时结合MATLAB统计工具去点拟合,分析出自变量与因变量之间的关系,上述模型可以推广到类似的统计回归模型求解中。可以对模型进行更深层次的分析,如问题三中,我们进一步分析了影响因变量的主要因素,这使得问题更加层次分明。

参考文献

[1] 汪天飞,数学建模与教学实验(第一版),北京:科学出版社,2013 [2] 韩中庚,数学建模方法及其应用(第二版),北京:高等教育出版社,2012。 [3] 姜启源,薛金星,叶俊,数学模型(第四版),北京:高等教育出版社,2011。

[4] 刘卫国,MATLAB程序设计与应用(第二版),北京:高等教育出版社,2002。 [5] 邓维斌,唐兴艳,胡大权,SPSS19统计分析实用教程(中文版),北京:电子工业出版社,2012。

附录

附录一:不同影响因素的数据求平均值得到的数据

Age Gender Cig_Day CO Min_last LogCOadj Day_abs 0.0000 1.0000 2.0000 3.0000 4.0000 5.0000 6.0000 7.0000 8.0000 9.0000 10.0000 11.0000 12.0000 13.0000 14.0000 15.0000 16.0000 17.0000 20.0000 21.0000 25.0000 26.0000 29.0000 30.0000 32.0000 33.0000 35.0000 36.0000 41.0000 42.0000 45.0000 47.0000 54.0000 55.0000 60.0000 62.0000 63.0000 64.0000 47.6667 45.1429 41.5000 41.8889 41.1000 43.0000 40.6667 44.0000 42.0000 55.5000 43.5000 45.0000 51.6667 39.5000 34.5455 42.6000 34.2500 35.0000 36.0000 36.0000 26.0000 42.0000 59.0000 40.0000 33.0000 35.0000 33.5000 60.0000 28.0000 66.0000 43.0000 52.6667 35.0000 33.0000 38.5000 62.0000 27.0000 47.0000 1.8333 1.5000 1.5500 1.5000 1.7000 1.6667 1.3333 1.3000 1.5000 1.5000 2.0000 1.0000 1.6667 1.2500 1.5455 1.6000 1.5000 2.0000 1.3333 1.8000 1.5000 2.0000 1.0000 2.0000 1.0000 2.0000 1.5000 1.0000 2.0000 1.0000 1.0000 1.3333 2.0000 2.0000 1.5000 1.0000 2.0000 2.0000 31.1667 252.0833 25.2857 318.5714 26.8889 302.2222 22.8333 300.0000 23.8333 255.0000 27.1000 362.0000 19.0000 190.0000 25.0000 25.0000 332.5000 30.0000 293.3333 15.0000 240.0000 29.0000 367.5000 114.7500 1410.8333 79.4286 1446.7143 75.0556 1441.1111 110.8333 1410.1667 66.6667 1384.3333 78.4000 1509.7000 30.5000 1246.5000 92.5000 1529.5000 78.3333 1448.0000 110.0000 1364.0000 41.5000 1531.7500 23.9500 278.0000 188.4500 1468.4500 28.5000 342.0000 166.7000 1454.0000 92.5000 636.0000 1254.5000 26.6364 215.4545 276.1818 1326.4545 22.0000 283.0000 135.0000 1405.4000 21.7500 211.2500 65.0000 1270.2500 66.0000 1582.0000 88.0000 1346.2000 30.0000 390.0000 22.6000 232.0000 28.3333 368.3333 128.3333 1588.3333 17.5000 107.5000 598.0000 1253.0000 20.0000 145.0000 143.0000 1202.0000 20.0000 300.0000 20.0000 315.0000 9.5000 65.0000 1468.0000 15.0000 1457.0000 30.0000 150.0000 120.0000 1202.0000 25.0000 260.0000 120.0000 1440.0000 82.5000 585.0000 1233.5000 95.0000 1214.0000 20.0000 1569.0000 60.0000 1330.0000 80.0000 1427.0000 110.0000 1284.0000 2.0000 1530.0000 86.0000 1207.0000 45.0000 1621.0000 75.0000 1645.0000 11.0000 160.0000 35.0000 405.0000 60.0000 220.0000 35.0000 267.5000 20.0000 190.0000 20.0000 25.0000 380.0000 9.0000 160.0000 50.0000 440.0000 40.0000 445.0000 60.0000 1110.0000 1435.0000 20.0000 180.0000 100.0000 1268.0000

64.0000 21.0000 27.0000 64.0000 56.0000 44.0000 37.0000 41.0000 28.0000 35.0000 36.0000 35.0000 63.0000 55.0000 32.0000 25.0000 53.0000 40.0000 37.0000 47.0000 28.0000 46.0000 50.0000 45.0000 46.0000 28.0000 26.0000 44.5806 1.0000 2.0000 1.0000 1.0000 2.0000 1.5000 1.0000 2.0000 2.0000 1.0000 1.0000 2.0000 1.0000 1.0000 2.0000 2.0000 2.0000 2.0000 1.0000 2.0000 2.0000 2.0000 2.0000 2.0000 1.0000 2.0000 2.0000 1.4516 40.0000 185.0000 15.0000 120.0000 20.0000 180.0000 60.0000 1254.0000 60.0000 1066.0000 55.0000 1239.0000 67.0000 71.0000 72.0000 74.0000 82.0000 90.0000 96.0000 97.0000 20.0000 140.0000 105.0000 1162.0000 20.0000 140.0000 108.0000 1164.0000 12.0000 160.0000 216.0000 1152.0000 23.0000 7.0000 85.0000 1440.0000 1797.0000 80.0000 674.0000 1282.0000 17.0000 285.0000 100.0000 1468.0000 106.0000 60.0000 350.0000 40.0000 500.0000 11.0000 150.0000 20.0000 270.0000 7.0000 1.0000 1494.0000 121.0000 10.0000 1654.0000 124.0000 90.0000 1182.0000 129.0000 30.0000 1399.0000 130.0000 23.0000 265.0000 130.0000 1455.0000 150.0000 40.0000 1320.0000 1393.0000 153.0000 75.0000 1459.0000 157.0000 30.0000 290.0000 4.0000 20.0000 40.0000 130.0000 372.0000 1300.0000 160.0000 40.0000 1080.0000 1240.0000 185.0000 85.0000 700.0000 1325.0000 196.0000 95.0000 1508.0000 235.0000 26.0000 1288.0000 237.0000 10.0000 1454.0000 252.0000 90.0000 1210.0000 266.0000 311.0000 50.0000 315.0000 5.0000 210.0000 10.0000 40.0000 315.0000 25.0000 160.0000 23.0000 40.0000 10.0000 90.0000 630.0000 1305.0000 244.0000 65.0000 1020.0000 1413.0000 302.0000 60.0000 1035.0000 1387.0000 90.0000 740.0000 1375.0000 335.0000 28.0000 225.3226 193.3548 1344.7097 365.0000 附录二:求回归系数以及置信区间的MATLAB程序 A=[47.6667

45.1429 41.5000 41.8889 41.1000 43.0000 40.6667 44.0000 42.0000 55.5000 43.5000 45.0000

1.8333 1.5000 1.5500 1.5000 1.7000 1.6667 1.3333 1.3000 1.5000 1.5000 2.0000 1.0000

31.1667 25.2857 23.9500 26.8889 28.5000 22.8333 23.8333 27.1000 19.0000 25.0000 25.0000 30.0000

252.0833 1410.8333 318.5714 1446.7143 278.0000 1468.4500 302.2222 1441.1111 342.0000 1454.0000 300.0000 1410.1667 255.0000 1384.3333 362.0000 1509.7000 190.0000 1246.5000 92.5000 1254.5000 332.5000 1529.5000 293.3333 1448.0000

51.6667 39.5000 34.5455 42.6000 34.2500 35.0000 36.0000 36.0000 26.0000 1.6667 1.2500 1.5455 1.6000 1.5000 2.0000 1.3333 1.8000 1.5000 15.0000 29.0000 26.6364 22.0000 21.7500 30.0000 28.3333 22.6000 17.5000 240.0000 1364.0000 367.5000 1531.7500 215.4545 1326.4545 283.0000 1405.4000 211.2500 1270.2500 390.0000 1582.0000 368.3333 1588.3333 232.0000 1346.2000 107.5000 1253.0000 42.0000 59.0000 40.0000 33.0000 35.0000 33.5000 60.0000 28.0000 66.0000 43.0000 52.6667 35.0000 33.0000 38.5000 62.0000 27.0000 47.0000 64.0000 21.0000 27.0000 64.0000 56.0000 44.0000 37.0000 41.0000 28.0000 35.0000 36.0000 35.0000 63.0000 55.0000 32.0000 25.0000 53.0000 40.0000 2.0000 1.0000 2.0000 1.0000 2.0000 1.5000 1.0000 2.0000 1.0000 1.0000 1.3333 2.0000 2.0000 1.5000 1.0000 2.0000 2.0000 1.0000 2.0000 1.0000 1.0000 2.0000 1.5000 1.0000 2.0000 2.0000 1.0000 1.0000 2.0000 1.0000 1.0000 2.0000 2.0000 2.0000 2.0000 20.0000 20.0000 30.0000 20.0000 25.0000 9.5000 11.0000 35.0000 60.0000 35.0000 20.0000 20.0000 25.0000 9.0000 50.0000 20.0000 40.0000 40.0000 15.0000 20.0000 20.0000 20.0000 12.0000 23.0000 7.0000 17.0000 60.0000 40.0000 11.0000 20.0000 23.0000 7.0000 30.0000 40.0000 4.0000 145.0000 300.0000 150.0000 315.0000 260.0000 82.5000 160.0000 405.0000 220.0000 267.5000 190.0000 60.0000 380.0000 160.0000 440.0000 180.0000 445.0000 185.0000 120.0000 140.0000 180.0000 140.0000 160.0000 85.0000 80.0000 285.0000 350.0000 500.0000 150.0000 270.0000 265.0000 40.0000 290.0000 130.0000 40.0000 1202.0000 1468.0000 1202.0000 1457.0000 1440.0000 1233.5000 1214.0000 1569.0000 1330.0000 1427.0000 1284.0000 1435.0000 1530.0000 1207.0000 1621.0000 1268.0000 1645.0000 1254.0000 1066.0000 1162.0000 1239.0000 1164.0000 1152.0000 1797.0000 1282.0000 1468.0000 1494.0000 1654.0000 1182.0000 1399.0000 1455.0000 1393.0000 1459.0000 1300.0000 1240.0000

37.0000 1.0000 20.0000 85.0000 1325.0000 47.0000 2.0000 50.0000 315.0000 1508.0000 28.0000 2.0000 5.0000 210.0000 1288.0000 46.0000 2.0000 10.0000 90.0000 1305.0000 50.0000 2.0000 40.0000 315.0000 1454.0000 45.0000 2.0000 25.0000 160.0000 1210.0000 46.0000 1.0000 23.0000 65.0000 1413.0000 28.0000 2.0000 40.0000 60.0000 1387.0000 26.0000 2.0000 10.0000 90.0000 1375.0000 44.5806 1.4516 28.0000 225.3226 1344.7097 ];

B=[0.0000 1.0000 2.0000 3.0000 4.0000 5.0000 6.0000 7.0000 8.0000 9.0000 10.0000 11.0000 12.0000 13.0000 14.0000 15.0000 16.0000 17.0000 20.0000 21.0000 25.0000 26.0000 29.0000 30.0000 32.0000 33.0000 35.0000 36.0000 41.0000 42.0000 45.0000 47.0000 54.0000 55.0000 60.0000 62.0000 63.0000 64.0000 67.0000 71.0000 72.0000 74.0000 82.0000 90.0000 96.0000 97.0000 106.0000 121.0000 124.0000 129.0000 130.0000 150.0000 153.0000 157.0000 160.0000 185.0000 196.0000 235.0000 237.0000 244.0000 252.0000 266.0000 302.0000 311.0000 335.0000 365.0000 ]; Y=B';

x1=A(:,1); x2=A(:,2); x3=A(:,3); x4=A(:,4); x5=A(:,5);

X=[ones(length(Y),1),x1,x2,x3,x4,x5]; [b,bint,r,rint,stats]=regress(Y,X,0.05); rcoplot(r,rint); b,bint,stats

附录三:多次去点拟合的MATLAB程序 A=[]; % A=[];B=[];同附录二; B=[]; Y=B';

x1=A(:,1); x2=A(:,2); x3=A(:,3); x4=A(:,4); x5=A(:,5); x6=x3.*x3; x7=x1.*x3;

x8=x2.*x3;

X=[ones(length(Y),1),x1,x2,x3,x4,x5,x6,x7,x8]; [b,bint,r,rint,stats]=regress(Y,X,0.05); rcoplot(r,rint); b,bint,stats

附录四:多次去点拟合的MATLAB程序 A=[]; % A=[];B=[];同附录二; B=[]; Y=B';

x1=A(:,1); x2=A(:,2); x3=A(:,3); x4=A(:,4); x5=A(:,5); x6=x3.*x3;

X=[ones(length(Y),1),x1,x3,x4,x5,x6]; [b,bint,r,rint,stats]=regress(Y,X,0.05); rcoplot(r,rint); b,bint,stats

附录五:多次去点拟合的MATLAB程序 A=[]; % A=[];B=[];同附录二; B=[]; Y=B';

x1=A(:,1); x2=A(:,2); x3=A(:,3); x4=A(:,4); x5=A(:,5); x6=x3.^2;

X=[ones(length(Y),1),x3,x4,x5,x6];

[b,bint,r,rint,stats]=regress(Y,X,0.05); rcoplot(r,rint); b,bint,stats

本文来源:https://www.bwwdw.com/article/0iux.html

Top