葡萄酒综合评价的数学模型建模论文.doc
《葡萄酒综合评价的数学模型建模论文.doc》由会员分享,可在线阅读,更多相关《葡萄酒综合评价的数学模型建模论文.doc(21页珍藏版)》请在咨信网上搜索。
1、 晋中学院数学学院 2014 届本科生毕业论文 葡萄酒综合评价的数学模型 学生姓名:王磊(数应 1002 班)指导教师:王惟 摘 要:文章通过分析附件中的数据.借助spss软件,运用t检验法讨论了两组评酒员对葡萄酒评价结果的可信度.然后利用主成分分析法得出综合主成分值并对酿酒葡萄进行分级,并根据配对样本检验法和双变量相关性分析法研究酿酒葡萄与葡萄酒的理化指标之间的联系.最后用多元线性回归法分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,从而得出相关结论:相关性越强即说明线性关系越明显,表明对其质量的影响越大.关键词:主成分分析;t 检验;多元线性回归;spss 软件;双变量相关性分析;理化指
2、标 晋中学院数学学院 2014 届本科生毕业论文 Mathematical Model of Comprehensive Evaluation of Wine Student:Wang Lei Instructor:Wang Wei Abstract:This article takes an analysis of the data in the attachment.With the help of spss software,we can use t-test to discuss the credibility of evaluation results of wine about t
3、wo groups wine taster and use principal component analysis method to obtain the comprehensive principal component scores which can be used to get the classification of wine grapes.According to the paired samples test and bivartite correlation analysis method,we can study the contact of the physicoch
4、emical indexes between wine grapes and wine.Finally,by using the multivariate linear regression method to analyze the influence of physicochemical indexes of wine grapes and wine on wines quality.We can draw the related conclusion:the stronger correlation,the better obvious linear relationship,indic
5、ating effect on quality of wine more.Key words:principal component analysis;t-independent sample test;multiple linear regression;spss software;bivariate correlation analysis;physicochemical index 晋中学院数学学院 2014 届本科生毕业论文 目目 录录 1 问题的提出 1 2 问题的分析 1 3 基本假设 2 4 符号说明 2 5 模型的建立与求解 2 5.1 问题一的模型建立与求解 2 5.1.1
6、分析红葡萄酒评价差异性 2 5.1.2 分析白葡萄酒评价差异性 3 5.1.3 分析评价结果可信度 5 5.2 问题二的模型建立与求解 6 5.3 问题三的模型建立与求解 8 5.4 问题四的模型建 14 5.4.1 红葡萄理化指标对葡萄酒质量的影响 14 5.4.2 红葡萄酒理化指标对葡萄酒质量的影响 15 6 模型的评价 16 7 模型的推广 16 参考文献 17 晋中学院数学学院 2014 届本科生毕业论文 1 1 问题的提出 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量.酿酒葡萄的好坏
7、与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量.附件一给出了某一年份一些葡萄酒的评价结果,附件二和附件三分别给出了该年份这些葡萄酒和酿酒葡萄的成分数据.尝试建立数学模型讨论下列问题1:问题一:分析附件一中两组评酒员评价结果有无显著性差异,哪一组结果更可信?问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒红葡萄进行分级.问题三:分析酿酒红葡萄与红葡萄酒的理化指标之间的联系.问题四:以酿酒红葡萄为例,分析酿酒红葡萄和红葡萄酒的理化指标对红葡萄酒质量的影响,并论证能否用红葡萄和葡萄酒的理化指标来评价红葡萄酒的质量?2 问题的分析 针对问题一,判断
8、两组评酒员的评价结果有无显著性差异和结果的可靠性比较,通过计算平均值和方差来观察.根据每一位评酒员的总分求和,再求平均值,得出红白葡萄酒的整体平均值,对两组评分进行 t-双样本等方差检验.根据 t 检验结果来分析两组评酒员评分结果是否存在显著差异性,通过描述四组数据的置信区间和均值标准差来确定他们评价结果的可靠性.针对问题二,根据酿酒葡萄的理化指标和葡萄酒的质量,使用主成分分析的方法对这些酿酒葡萄进行分级.首先对原始数据进行标准化处理,计算出相关系数矩阵,通过计算出的特征值来选择数个主成分,通过 spss 软件求解出主成分,根据主成分来确定各酿酒葡萄的综合主成分分值,最后根据综合主成分值的高低
9、对葡萄进行分级2.针对问题三,根据附件二中提供的酿酒红葡萄与红葡萄酒的理化指标数据,分析他们之间的联系.首先通过 excel 对数据进行处理,挑选出两者共有的理化指标,多次测量的求取其平均值作为参考数据,整理归纳之后,利用 spss 软件进行双变量相关性分析.针对问题四,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量.分析附件二中的红葡萄酒和红葡萄 晋中学院数学学院 2014 届本科生毕业论文 2 所有的一级理化指标,使用多元线性回归的方法对理化指标进行处理,相关性强即说明线性关系比较明显,对其质量的影响较大3.3 基本假设(1).两组评酒
10、员之间的分数是相对独立的,每个评酒员之间互不影响;(2).两组评酒员是随机分配的,两个总体分布都服从正态分布;(3).用来检验的葡萄都是采摘的新鲜的葡萄,葡萄酒也没有受到污染;(4).假设评酒员的系统误差较小,忽略不计;(5).只考虑红葡萄酿成红葡萄酒,白葡萄酿成白葡萄酒,而不考虑多种葡萄 混合酿成的葡萄酒;(6).假设题目中所给出的数据和其他内容都真实可信.4 符号说明 iX:表示第i组红葡萄酒评酒员评分的平均(i1,2);jY:表示第j组白葡萄酒评酒员评分的平均(j1,2);xW:各个酿酒红葡萄综合主成分得分(1x,2,27);y:用红葡萄酿成的红葡萄酒的质量;n:表示酿酒红葡萄第n种主成
11、分的特征值(1n,2,8);xnF:酿酒红葡萄样品对各个主成分的得分.5 模型的建立与求解 5.1 问题一的模型建立与求解 5.1.1 分析红葡萄酒评价差异性 首先根据附件一中的数据,分析红葡萄酒的评价结果,利用 excel 分别计算出每组的 10 位评酒员对 27 种红葡萄酒样品的平均值,如表 1 所示.由表 1 计算可知,05556.731X,51481.702X,由此可见,第一组评酒员对红葡萄酒的评价略高.但是,仅凭平均值的差异不能完整地反映出这两组评价结果的差异性,所以根据表 1 中的数据,设显著性水平05.0,置信度为%95,建立零假设0H:21,运用 spss 软件进行独立样本 t
12、 检验,检验结果如表 2、表 3 所示4.晋中学院数学学院 2014 届本科生毕业论文(设计)3 表 1 红葡萄酒样品平均值 酒样品 1 酒样品 2 酒样品 3 酒样品 4 酒样品 5 酒样品 6 酒样品 7 一组 62.7 80.3 80.4 68.6 73.3 72.2 71.5 二组 68.1 74 74.6 71.2 72.1 66.3 65.3 酒样品 8 酒样品 9 酒样品 10 酒样品 11 酒样品 12 酒样品 13 酒样品 14 一组 72.3 81.5 74.2 70.1 53.9 74.6 73 二组 66 78.2 68.8 61.6 68.3 68.8 72.6 酒样
13、品 15 酒样品 16 酒样品 17 酒样品 18 酒样品 19 酒样品 20 酒样品 21 一组 58.7 74.9 79.3 59.9 78.6 78.6 77.1 二组 65.7 69.9 74.5 65.4 72.6 75.8 72.2 酒样品 22 酒样品 23 酒样品 24 酒样品 25 酒样品 26 酒样品 27 一组 77.2 85.6 78 69.2 73.8 73 二组 71.6 77.1 71.5 68.2 72 71.5 表2 组统计量 样本 N 均值 标准差 均值的标准误 均值 1 27 73.056 7.3426 1.4131 2 27 70.515 3.9780
14、0.7656 分析表2、表3可知,对两组评酒员的数据做方差齐性检验,得出的F值为3.861,P值为055.0,由于P值大于显著性水平05.0,所以认为不能拒绝零假设,即两组数据的方差相等,再通过t检验的结果知双侧的概率值均大于显著性水平05.0.综上所述,认为两组评酒员对红葡萄酒的评价结果无显著性差异.5.1.2 分析白葡萄酒评价差异性 同上述解决方法一样,首先根据附件一中的数据,利用excel分别计算出每组的10位品酒员对 28 种白葡萄酒样品的平均值,如表 4 所示.由表 4 计算可知,37143.741Y,53214.762Y,由此可见,第二组品酒员对白葡萄酒的评价略高.同样,根据表 4
15、 中的数据,设显著性水平05.0,置信度为%95,建立零假设0H:21,运用spss软件进行独立样本t检验,检验结果如表5、表6所示.晋中学院数学学院 2014 届本科生毕业论文 4 表3 独立样本检验 方差方程的 Levene 检验 均值方程的 t 检验 F Sig.t Df Sig.(双侧)均值差值 标准误差值 差分的 95%置信区间 下限 上限 均值 假设方差相等 3.861 0.055 1.581 52 0.120 2.5407 1.6071-0.6842 5.7657 假设方差不相等 1.581 40.052 0.122 2.5407 1.6071-0.7073 5.7888 表 4
16、 白葡萄酒样品平均值 表 5 组统计量 样本 N 均值 标准差 均值的标准误 均值 1 28 74.371 4.4586 0.8426 2 28 76.532 3.1709 0.5993 酒样品 1 酒样品 2 酒样品 3 酒样品 4 酒样品 5 酒样品 6 酒样品 7 一组 82 74.2 78.3 79.4 71 68.4 77.5 二组 77.9 75.8 75.6 76.9 81.5 75.5 74.2 酒样品 8 酒样品 9 酒样品 10 酒样品 11 酒样品 12 酒样品 13 酒样品 14 一组 71.4 72.9 74.3 72.3 63.3 65.9 72 二组 72.3 8
17、0.4 79.8 71.4 72.4 73.9 77.1 酒样品 15 酒样品 16 酒样品 17 酒样品 18 酒样品 19 酒样品 20 酒样品 21 一组 72.4 74 78.8 73.1 72.2 77.8 76.4 二组 78.4 67.3 80.3 76.7 76.4 76.6 79.2 酒样品 22 酒样品 23 酒样品 24 酒样品 25 酒样品 26 酒样品 27 酒样品 28 一组 71 75.9 73.3 77.1 81.4 74.8 81.3 二组 79.4 77.4 76.1 79.5 74.3 77 79.6 晋中学院数学学院 2014 届本科生毕业论文 5 表6
18、 独立样本检验 分析表 5、表 6 可知,对两组品酒员的数据做方差齐性检验,得出的F值为746.2,P值为103.0,由于P值大于显著性水平05.0,所以认为不能拒绝零假设,即两样本的方差相等.再通过 t 检验可知,对应第一行的 t 检验结果,t 统计量的值为090.2,对应的概率P值为041.005.0,故拒绝原假设,即两组品酒员对白葡萄酒样品的评价有显著性差异.5.1.3 分析评价结果可信度 分析可信度,由于置信区间越大,置信度越小;置信区间越小,置信度越大.可根据置信区间的大小和样本的标准差来综合判断评价结果的可信度.在 spss 中对四组数据进行单个样本 t 检验,得到了样本统计量表和
19、单个样本 t 检验的表格,如表 7、表 8 所示.表 7 单个样本统计量 N 均值 标准差 均值的标准误 红一 27 73.056 7.3426 1.4131 红二 27 70.515 3.9780 0.7656 白一 28 74.37 4.459 0.843 白二 28 76.532 3.1709 0.5993 方差方程的 Levene 检验 均值方程的 t 检验 F Sig.t df Sig.(双侧)均值差值 标准误差值 差分的 95%置信区间 下限 上限 均值 假设方差相等 2.746 0.103-2.090 54 0.041-2.1607 1.0340-4.2337-0.0878 假设
20、方差不相等 -2.090 48.749 0.042-2.1607 1.0340-4.2388-0.0826 晋中学院数学学院 2014 届本科生毕业论文 6 表 8 单个样本检验 检验值=0 T df Sig.(双侧)均值差值 差分的 95%置信区间 下限 上限 红一 51.699 26 0.000 73.0556 70.151 75.960 红二 92.108 26 0.000 70.5148 68.941 72.088 白一 88.265 27 0.000 74.371 72.64 76.10 白二 127.713 27 0.000 76.5321 75.303 77.762 由表 7、表
21、 8 可以明显看出,第一组评酒员对红、白葡萄酒的评价的置信区间略大于第二组评酒员对红白葡萄酒评价的置信区间,并且第一组品酒员对红、白葡萄酒评分的均值标准误差大于第二组品酒员对红、白葡萄酒评分的均值标准误差,所以认为第二组品酒员对红、白葡萄酒的评价更具有可信度.通过上述的分析可知,评酒师通过感官评价葡萄酒质量,带有一定的主观性,因此有必要根据酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量.5.2 问题二的模型建立与求解 讨论酿酒红葡萄的分级,根据酿酒红葡萄的理化指标和红葡萄酒的质量对酿酒葡 萄进行分级.主成分分析法原理:主成分分析是把原来多个变量化为少数几个综合指标的一种分析统计方法,主成分因子并
22、不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息.主成分个数提取原则为主成分对应的特征值大于 1 的前 m 个主成分.特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于 1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于 1 作为纳入标准.在考虑酿酒葡萄的理化指标时,主要分析一级理化指标,忽略二级理化指标对酿酒葡萄分级的影响.根据题可知,酿酒红葡萄有 30 个一级理化指标,首先在 excel 中求出各个理化指标的均值,然后在 spss 中进行主成分分析,得到了
23、解释的总方差5,见附表 1.根据附表 1,选择特征值大于 1 的前八个主成分,为消除量纲不同的影响,在 spss 晋中学院数学学院 2014 届本科生毕业论文 7 中对理化指标进行标准化处理,得到了标准化矩阵,用标准化矩阵乘以成分得分系数矩阵就可以得到酿酒葡萄样品对各个主成分得分xnF.然后再由公式xnnnnnxFW8181即可算出各个酿酒红葡萄样品的综合主成分得分.其中966.61,940.42,737.33,840.24,999.15,742.16,418.17,270.18.计算出的综合主成分得分如表 9 所示.表 9 红葡萄综合主成分得分 样品 1 样品 2 样品 3 样品 4 样品
24、5 样品 6 样品 7 综合得分 033.0 018.0 049.0 0 003.0 021.0 026.0 样品 8 样品 9 样品 10 样品 11 样品 12 样品 13 样品 14 综合得分 051.0 061.0 041.0 0 019.0 046.0 019.0 样品 15 样品 16 样品 17 样品 18 样品 19 样品 20 样品 21 综合得分 035.0 003.0 008.0 029.0 025.0 005.0 073.0 样品 22 样品 23 样品 24 样品 25 样品 26 样品 27 综合得分 049.0 021.0 034.0 017.0 044.0 02
25、9.0 由表 9 可知,可以对酿酒红葡萄分为三个等级,分别为优(03.0,08.0),中(02.0,03.0),差(07.0,02.0),分级表格见表 10 所示6.表 10 酿酒红葡萄分级 差(07.0,02.0)中(02.0,03.0)优(03.0,08.0)酿酒红葡萄样品 3、7、8、9、10、13、18、22、23、26 2、4、5、6、11、12、14、16、17、19、20、25、27 1、15、21、24 晋中学院数学学院2014届本科生毕业论文 8 5.3 问题三的模型建立与求解 分析酿酒红葡萄与红葡萄酒的理化指标之间的联系.通过 excel 对数据进行处理,挑选出酿酒葡萄和葡
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 葡萄酒 综合 评价 数学模型 建模 论文
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。