毕业设计-co对吸烟的危害数学建模.doc
《毕业设计-co对吸烟的危害数学建模.doc》由会员分享,可在线阅读,更多相关《毕业设计-co对吸烟的危害数学建模.doc(17页珍藏版)》请在咨信网上搜索。
1、摘要众所周知,吸烟不仅危害自身健康,而且由此引起的被动吸烟更是危害公众身心健康的主要原因。为此,如何帮助相关人士摆脱烟瘾的困扰也就成为一个重要的研究课题。本文对题中所给数据进行深入细致的处理和分析,利用EXCEL作图,MATLAB拟合和SPSS相关性检验建立数学模型,探寻影响戒烟成功的主要因素,并在最后根据本文的相关研究结果对广大有志于戒烟的烟民提出了几条科学合理的建议。针对问题一,为了能够直观的看出再次吸烟者的累加发病率的分布情况,利用数理统计分析知识和EXCEL知识对各影响因素的调查数据进行的筛选、分组和数值统计,采用控制变量法分别对性别,年龄,每日抽烟支数,CO浓度和调整CO浓度分别进行
2、分析,用数理统计知识进行分组、统计,整理出再次吸烟者累加发病率条形分布图,即得到再次吸烟者的累加发病率分布情况。针对问题二,考虑到要定量分析年龄、性别、每日抽烟支数及调整的CO浓度等因素会影响戒烟时间即天数的长短。首先用EXCEL进行数据筛选,删掉缺失的数据,其次,对224名戒烟时间一样的研究对象的不同影响因素的数据求均值,建立统计回归模型,并结合MATLAB统计工具进行多次去点拟合,得到回归系数,用多重判断系数评价模型拟合的优度,用检验统计量、等判断自变量对因变量的影响是否显著,最后,用SPSS的Pearson 相关性检验,找出可靠性较高的模型,用控制变量法对线性回归模型进行定量分析,得出关
3、系式为:针对问题三,在问题二分析的基础上可知戒烟是否成功可用戒烟时间的长短来刻画,则戒烟成功的因素有研究对象的每日抽烟支数、CO浓度及调整的CO浓度,建立多元线性统计回归模型,并结合MATLAB统计工具进行统计回归分析,经过多次去点拟合,得到回归系数,进一步写成回归方程,经过可靠性分析,即可得出影响戒烟成功的主要因素为每日抽烟支数。 针对问题四,根据一、二、三的分析结果,得到影响戒烟成功的主要因素,根据这些因素对戒烟者提出了合理的建议。关键词: 统计回归模型 数理统计 MATLAB去点拟合 相关性分析一、问题重述众所周知,吸烟不仅危害自身健康,而且由此引起的被动吸烟更是危害公众身心健康的主要原
4、因。为此,如何帮助相关人士摆脱烟瘾的困扰也就成为一个重要的研究课题。本文研究数据涉及 234人,他们都自愿表示戒烟但还未戒烟。在他们戒烟的这一天,测量了每个人的CO(一氧化碳)水平并记下他们抽最后一支烟到CO测定时间.。 CO的水平提供了一个他们先前抽烟数量的客观指标,但其值也受到抽最后一支烟的时间的影响, 因此抽最后一支烟的时间可以用来调整CO的水平。记录下研究对象的性别、年龄及自述每日抽烟支数。这个调查跟踪1年, 考察他们一直保持戒烟的天数, 由此估计这些人中再次吸烟的累加发病率, 也就是原吸烟者戒烟一段时间后又再吸烟的比例. 其中假设原烟民戒烟的可信度是很低的(更恰当地说多数是再犯者)戒
5、烟天数是从0到他(她)退出戒烟或研究截止时间(1 年)的天数。假定他们全部没有人中途退出研究。请回答下列问题:1)试分析上述234人中再次吸烟的累加发病率分布情况(如不同年龄段、不同性别等因素下的累加发病率分布情况)。2)你认为年龄、性别、每日抽烟支数及调整的CO浓度等因素会影响戒烟时间(天数)长短吗?如果影响请利用附录中的数据,分别给出戒烟时间与上述你认为有影响的因素之间的定量分析结果。3)请利用附录中的数据建立适当的数学模型,讨论影响戒烟成功的主要因素有哪些,并对你的模型进行可靠性分析。4)请根据你的模型,撰写一篇500字左右的短文,向有志于戒烟的人士提供戒烟对策和建议。二、问题分析2.1
6、问题一的分析首先,我们先分析数据,发现有数据不全的被调查者,利用EXCEL将数据不全的被调查者删除,从234个被调查者中共去除了10个数据不全的。然后对剩余的224个被调查者进行分析,为了能够直观的看出再次吸烟的累加发病率的分布情况,我们采用控制变量法分别对性别,年龄和每日抽烟支数进行分析,用数理统计知识进行分组、统计,整理出累加发病率分布表,并作出条形图能够更加直观反映,根据条形图可以分析出224人中再次吸烟的累加发病率的分布情况。2.2问题二的分析考虑到要定量分析年龄、性别、每日抽烟支数及调整的CO浓度等因素是否会影响戒烟时间即天数的长短,首先用EXCEL进行数据筛选,删掉缺失的数据,然后
7、对224名戒烟时间一样的研究对象的不同影响因素的数据求平均值。最后建立统计回归模型,利用MATLAB统计工具进行统计回归分析,经过多次去点拟合,得到回归系数、置信区间(=0.05)以及检验统计量、的值,并用SPSS 中的Pearson 相关性检验综合分析戒烟时间与其影响的各因素之间的关系。2.3问题三的分析由问题二的分析可知:戒烟时间的长短与研究对象的年龄、研究对象每日抽烟支数、CO浓度及调整的CO浓度有关。而此问题又考虑到戒烟是否成功的主要因素,那么戒烟是否成功可用戒烟时间的长短来衡量,假设戒烟是否成功与每日抽烟支数,CO浓度及调整CO浓度有关,在问题二给出的统计回归模型上稍加修改,利用MA
8、TLAB统计工具进行统计回归分析,经过多次去点拟合,得到回归系数、置信区间(=0.05)以及检验统计量、的值,进行相关性分析,得出影响戒烟成功的主要因素。2.4问题四的分析 吸烟者戒烟成功通常需要两个条件,一是戒烟的动机,二是戒烟的技能和帮助。根据前面对问题一、二、三的讨论分析结果,题出对有志于戒烟的人士的合理戒烟建议。三、模型假设与符号说明3.1基本假设1)假设原烟民戒烟的可信度是很低的。2)假设数据中的缺失值的忽略对总体信息不会有显著影响。3)假设数据都是可靠的,不包括人为造成的不合理因素。4)本题涉及的234人是从愿意戒烟人群中随机抽取的。5)凡是戒烟天数没有达到365天的调查者都算是再
9、次吸烟人群。6)假设在调查期间没有人员的伤亡等因素而造成影响。7)假设在此期间没有人员退出研究。3.2符号说明:研究对象的年龄。:研究对象的性别。:研究对象每日抽烟支数。:CO浓度。:调整的CO浓度。:回归系数()。:戒烟天数。:随机误差。四、模型建立与求解4.1问题(一):乘车费用与乘车时间的关系4.1.1模型建立对题中数据分析之后,从234个调查者中共去除了10个数据不全的。然后对剩余的224个调查者进行分析,为了能够直观的看出再次吸烟的累加发病率的分布情况,我们采用控制变量法分别对性别,年龄,每日抽烟支数和CO浓度进行分析,用数理统计知识进行分组、统计,整理出累加发病率分布表,并利用EX
10、CEL软件作出条形图能够更加直观反映,根据条形图可以分析出224人中再次吸烟的累加发病率的分布情况。4.1.2模型求解4.1.2.1性别因素分析首先,利用数理统计知识对性别因素进行分析,整理得出累加发病率的分布表如表1.1。表1.1男女的累加发病率分布表性别总人数戒烟成功人数戒烟失败人数累加发病率男104168738.84%女1201410647.32%利用EXCEL软件作出男女的累加发病率的条形图如图1.1。图1.1男女的累加发病率的条形图由条形图可知,男性与女性的累加发病率基本相同,但是女性的累加发病率要稍大于男性的。4.1.2.2年龄因素分析利用数理统计知识对年龄因素进行分析,整理得出累
11、加发病率的分布表如表1.2。表1.2不同年龄段的累加发病率分布表年龄人数戒烟成功人数戒烟失败人数累加发病率20-305164520.09%31-405775022.32%41-505684821.43%51-603943515.63%61-70165114.91%71-805141.79%利用EXCEL软件作出不同年龄段的累加发病率的条形图如图1.2。图1.2不同年龄段的累加发病率的条形图根据条形图可以判断出,累积发病率在31-40岁最高,在40岁之后,随着年龄的增长,累积发病率在逐渐减小。在70岁之后累加发病率明显减小,可能是因为调查人数比较少,基数小。4.1.2.3每日抽烟支数因素分析利用
12、数理统计知识对每日抽烟支数因素进行分析,整理得出累加发病率的分布表如表1.3。表1.3不同每日抽烟支数因素下累加发病率每日抽烟支数总人数戒烟成功人数戒烟失败人数累加发病率0-10264229.82%11-207786930.80%21-3069125725.45%31-403643214.29%41-508173.13%50-1008262.68%利用EXCEL软件作出不同每日抽烟支数因素下累加发病率条形图如图1.3。图1.3不同每日抽烟支数因素下累加发病率条形图 由图表分析可知,每日抽烟支数在11-20支的时候,累加发病率最大,在大于50 的时候累加发病率是最低的。在每日抽烟支数超过10支得
13、时候,随着抽烟支数的增加,累加发病率逐渐减小,这其中的原因是每天抽烟支数多的人群所占的比例很少,所以累加发病率也会小。4.1.2.4 CO浓度数因素分析利用数理统计知识对CO浓度数因素因素进行分析,整理得出累加发病率的分布表如表1.4。表1.4不同CO浓度时的累加发病率CO浓度区间总人数戒烟成功人数戒烟失败人数累加发病率0-20086157131.70%201-400105139241.07%401-6003132812.50%601-8001010.45%801-10001010.45%利用EXCEL软件作出不同CO浓度因素下累加发病率条形图如图1.5。图1.5不同CO浓度因素下累加发病率条
14、形图根据图表可得出,CO浓度在201-400的时候,累加发病率最大,在CO浓度超过400时,随着CO浓度的增加,累加发病率在逐渐减小。在CO浓度超过600之后,累加发病率极低,是因为浓度超过600的人数极少。4.1.2.4 调整CO浓度数因素分析利用数理统计知识对LogCOadj浓度数因素因素进行分析,整理得出累加发病率的分布表如表1.6。表1.6不同LogCOadj浓度时的累加发病率LogCOadj浓度区间总人数戒烟成功人数戒烟失败人数累加发病率0-100011383.57%1000-1200192177.59%1200-14007096127.23%1400-160092147834.82
15、%1600-18003032712.05%1800-20002020.89%利用EXCEL软件作出不同LogCOadj浓度因素下累加发病率条形图如图1.6。图1.6不同LogCOadj浓度因素下累加发病率条形图 上图则是不同调整CO浓度情况下的累加发病率,由图可以看出在(1400-1600)这个区间的时候累加发病率最大,在大于1800的时候累加发病率最低,在调整浓度在大于1400的时候,随着浓度的增大,累加发病率在逐渐减小。4.2问题(二):4.2.1 模型建立首先用Excel进行数据处理,删掉缺失的数据,得到的224组数据,然后对224名戒烟时间一样的研究对象的不同影响因素的数据求平均值得到
16、的数据(见附录一)。由于题中要求定量分析,所以建立多元线性回归分析模型。用相关系数评价回归方程拟合优度的度量,统计量和概率值来检验自变量对因变量的影响是否显著。 假设影响戒烟时间的各个因素之间互不影响,且相互独立,并且与戒烟时间呈线性相关,则建立一元线性回归方程的数学模型为:其中、是待估计的回归系数,是随机误差。由上表的数据估计,影响的其他因素都包含在随机误差中,若模型选择的合适,那么应大致服从均值为0的正态分布。4.2.2模型求解直接利用MATLAB统计工具箱中的regress命令求解(程序见附录二),得到回归系数以及置信区间(置信水平为0.05)、检验统计量、的结果如表2.1。表2.1模型
17、一的计算结果参数参数估计值置信区间-113.9430-433.1318 ,205.2459-0.2086-2.5226 , 2.105438.8912-19.9661 , 97.74841.8081-0.4674 , 4.0836-0.4936-0.7694 , -0.21780.1566-0.0529 ,0.3662=0.20937 =3.1779 0.01305 =7498.3由上表显示,=0.20937指因变量戒烟天数的20.937%可由模型确定,而的值相对来说较小,拟合程度较低,显著性不高。因此需要做进一步的改进。4.2.3模型改进上述模型是我们假设各个变量之间没有交互作用实现的,但是
18、模型结果显示拟合程度不高,所以各个变量之间应该有一些交互作用,因此我们用SPSS双因素相关性分析,分析各个因素之间的相关性,分析结果如表2.2。表2.2相关性分析相关性年龄性别每日抽烟支数CO浓度距分钟调整CO浓度戒烟天数年龄Pearson 相关性1-.166*.115-.052-.110-.089-.062显著性(双侧).021.111.476.126.218.391N193193193193193193193性别Pearson 相关性-.166*1-.018-.085.120-.097.094显著性(双侧).021.805.241.095.181.193N19319319319319319
19、3193每日抽烟支数Pearson 相关性.115-.0181.408*-.182*.390*-.054显著性(双侧).111.805.000.011.000.454N193193193193193193193CO浓度Pearson 相关性-.052-.085.408*1-.503*.809*-.266*显著性(双侧).476.241.000.000.000.000N193193193193193193193距分钟Pearson 相关性-.110.120-.182*-.503*1-.031.342*显著性(双侧).126.095.011.000.672.000N1931931931931931
20、93193调整CO浓度Pearson 相关性-.089-.097.390*.809*-.0311-.107显著性(双侧).218.181.000.000.672.138N193193193193193193193戒烟天数Pearson 相关性-.062.094-.054-.266*.342*-.1071显著性(双侧).391.193.454.000.000.138N193193193193193193193*. 在 0.05 水平(双侧)上显著相关。*. 在 .01 水平(双侧)上显著相关。从表中可以观察到,年龄、性别与每日抽烟支数的相关性较大,而且根据常识,他们之间有交互项,则得到新模型为:
21、其中、是待估计的回归系数, 是随机误差。利用MATLAB工具进行多次去点拟合(程序见附录三),去点拟合过程中采用残差分析方法,用rcoplot命令绘制残差图,以第一次建立的线性回归模型为例做出残差图进行分析:图2.1残差分析图从图中可以看出除倒数第一二个数据及第八个数据外,其余残差离零点较近,并且残差的置信区间都包含零点,说明模型中的这些数据能较好的模拟原始数据,是可用的。而图中虚线部分数据可视为异常数据,可予以剔除后重新计算线性回归系数。如此下去,进行多次去点拟合,初步得到了回归系数、置信区间(置信度为0.05)以及检验统计量、的结果如表2.3。表2.3模型二的计算结果参数参数估计值置信区间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 co 吸烟 危害 数学 建模
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。