大学生数学建模竞赛A题.doc
《大学生数学建模竞赛A题.doc》由会员分享,可在线阅读,更多相关《大学生数学建模竞赛A题.doc(34页珍藏版)》请在咨信网上搜索。
1、个人收集整理 勿做商业用途葡萄酒质量的评价摘 要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量.首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合数据分析,发现对于红葡酒有的评价结果存在显著性差异,对于白葡萄酒只有53%的评
2、价结果存在显著性差异。通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。为了评价两组结果的可信度,借助Alpha模型用克伦巴赫系数衡量,并结合检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。综合来看,主观因素对葡萄酒质量的评价具有不确定性。结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚类分析法,利用SPSS软件对葡萄酒样进行分
3、类,根据分类的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映出两者间的联系,取与葡萄各成分相关性显著的葡萄酒理化指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。由于已经通过回归分析建立了酿酒葡萄和葡萄酒理化指标之间的关系,因此从酿酒葡萄成分对葡萄酒的理化指标的影响,再研究出葡萄酒理化指标与葡萄酒质量的联系,便可作为一个桥梁,反映出葡萄与葡萄酒理化指标对
4、葡萄酒的质量的作用.研究葡萄酒理化指标与葡萄酒质量的联系,需要运用变量间的相关性及系数法分析葡萄酒的理化指标与葡萄酒质量评价指标的相关性,通过比较选出与葡萄酒评价的一级指标相关性程度大的葡萄酒成分,进行回归分析法,建立酿酒葡萄的理化指标与葡萄酒质量之间的拟合方程,结合各个质量一级指标的权重,从而完成了从葡萄酒成分对葡萄酒质量的客观评价。综合计算结果,与酿酒葡萄分级的结果吻合,所以分析结果较客观。关键词:葡萄酒 双重多因素分析 数据分析 Alpha模型 聚类分析及欧式距离相关性分析 多元回归 系数法1. 问题重述葡萄酒的感官质量是评价葡萄酒质量优劣的重要标志。确定葡萄酒质量时一般是通过聘请一批有
5、资质的评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量,可辅助感官检查。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据.试建立数学模型求解下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2。 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄
6、酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2. 问题分析酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量,本题要求通过酿酒葡萄的理性指标和酿酒师给予的评分,综合考虑酿酒葡萄的理性指标与葡萄酒的质量的关系。问题一:要求对两组评酒员评价结果有无差异性进行分析,并分析得出哪一组的品酒员的结果更具有可信。通过绘制每个样品酒的均值评分差异图,对每个样品酒的两组评酒员在各个指标的均值进行比较,发现对于红葡萄的评价,两组评酒员还是存在着显著性的差异的,而对于白葡萄酒的评价,两组评酒员的差异性并不是很明显,列举部分红、白
7、葡萄酒评分差异图如下: 图表 1红葡萄酒样品12差异图(左边),系列1为第二组品酒员打分均值,系列2为第一组品酒员打分均值。图表 Error! Bookmark not defined.红葡萄酒样品15差异图(右边),横坐标为10个指标变量,包括澄清度、色调、香气纯正度、香气浓度、香气质量、口感纯正度、口感浓度、口感质量以及整体评价。 针对两组评酒员在大量差异图中表现出来对红、白葡萄酒的评价存在差异,对红、白葡萄酒进行分开地显著性检验。第一步,利用每个样品酒都具有两组评酒员的评价结果,对两组结果进行双因子可重复方差分析,得出题中给出的27种葡萄样品酒各个分析结果.比较27个显著性检验的结果,若
8、具有显著性差异的样品酒占总样品酒的比例高于,有足够的把握认定两组评酒员的评价结果具有显著性差异。第二步,对两组评酒员给予红、白葡萄酒的打分进行可信性分析,将红、白葡萄酒分别进行可信度分析,比较两组评酒员对不同种类葡萄酒的评价是否具有各自的优势。在进行双因子多重分析和可信性分析之前,需要对原先数据进行如下处理:1。对于附件1给出的数据,先将两组品酒员的评价结果按着样品酒进行统一划分,每一样品酒对应着两种评价结果.将每一样品酒的评价结果组成评价矩阵,矩阵以葡萄酒的评价指标为列项,共10列,以每个评酒员作为横向量,共20行。2。针对红葡萄酒样品20评酒员4号对色调的评分缺失,利用同组评酒员对红葡萄酒
9、样品20色调评分的平均值作为4号评酒员的评分值。做可信度分析时,将两组的27种酒样品评价结果组成两组评价总矩阵,以葡萄酒的评价指标为列项,共10列,以每个评酒员作为横向量,共270行,分别用SPSS19.0对两组矩阵进行信度分析,目的是对量表的可靠性与有效性进行检验,判断出哪一组可信度更高。问题二:问题二要求对酿酒葡萄进行分级,酿酒葡萄的成分直接影响葡萄酒的质量,选取优质营养成分高的酿酒葡萄酿酒,保证了葡萄酒的营养价值和保健价值.但是葡萄酒质量优劣,不单单从营养成分和养身价值上考虑,一瓶优质的葡萄酒,还得具备着可观赏性,纯正的口感、芬芳的酒香等优点,而这些优点,都得由评酒员来给出评价。所以,对
10、酿酒葡萄进行分级,不单单从葡萄的成分上考虑,还得结合最终酿成的葡萄酒质量综合考虑。因此将酿酒葡萄的各成分与评价员给予所酿成的葡萄酒的质量打分综合起来,进行聚类分析,将酿酒葡萄依据综合指数进行分类,结合聚类分析的结果以及综合指标的分数将葡萄划分等级。依据:在进行据聚类分析之前,需要对原始数据进行预先处理1. 分别计算附件一中评酒员各项评分指标的权重并加和,最后求取10位评酒员的权重平均值作为葡萄酒样品的综合评价指标。2. 用酿酒葡萄各项理化指标(多次测得的取平均值)以及酒样的综合指标形成一个31列28行的原始资料阵,并用SPSS 的标准化将数据标准化。问题三:酿酒葡萄和葡萄酒的理化指标都很多,为
11、了找出它们之间的联系,首先将葡萄的成分与葡萄酒的理性指标列成一个大矩阵,分析葡萄成分与葡萄酒理想指标的相关性,找出它们之间相关性大的指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。1. 酿酒葡萄的成分和葡萄酒的理化指标列成一个大矩阵。2. 通过SPSS软件做相关性分析,选取与葡萄酒理化指标相关性程度大的葡萄酒成分个指标,建立拟合方程。问题四:酿酒葡萄的理化指标并不能直接与葡萄酒的质量建立联系,由于在问题3中已经通过相关性分析建立了酿酒葡萄和葡萄酒理化指标之间的关系,因此我们分析葡萄酒的理化指标与葡萄酒质量的相关性,计算相关性系数
12、,通过比较选出系数高的即与葡萄酒质量指标相关性程度大的葡萄酒成分,进而用回归分析法建立酿酒葡萄的理化指标与葡萄酒质量之间的关系。1附表一中列出了十位品酒员对葡萄酒外观、香气和口感分析三者的数据,用Matlab7.6。0b,分别对四项指标求27(28)种红(白)葡萄酒样品权重平均值作为葡萄酒质量的评价指标.2. 通过SPSS软件作因子分析分析两者之间的相关性,选取与葡萄酒质量指标相关性程度大的葡萄酒成分个指标,建立拟合方程。3. 符号说明显著性水平置信度误差平方和行组间误差列组间误差组内误差克伦巴赫系数明考斯基距离欧式距离4. 模型假设(1) 假设数据来源真实有效(2) 假设各变量的相差微小,各
13、坐标对欧式距离的贡献是同等的且变差大小相同,欧氏距离效果理想。(3) 假设酿酒工艺条件相同,无其他人为因素影响(4)为低信度,则尚可,若则属于高信度。假设组一与组二评分分别处于不同信度区间,可信度差异明显。5. 建模过程5.1. 问题一的建模与求解模型建立:利用双因素可重复方差分析结合0-1分析检验两组评酒员的评价结果有无显著性差异1。双因子可重复方差分析的统计模型。假设在两因子方差分析中,因子共有个水平,记作,每个水平下,进行次试验,因子共有个水平。一个典型的双因子方差分析的数据结构如下表所示.表格 Error! Bookmark not defined. 双因子可重复方差分析的数据结构因子
14、因子为因子的某个水平下第试验所得结果,表示因子的第个水平,。第列数据为因子的第个水平下所考察的变量取值,每一列为一个总体,=1,2,。所以一个两因子方差分析的数据结构表里,共有个总体,在本题中,.下表给出因子所对应的各个指标:指标外观澄清度外观色调香气纯正度香气浓度香气质量口感纯正度口感浓度口感持久性口感质量整体得分给出双因子可重复方差分析的原假设和备择假设: 当原假设为真时,说明两组评酒员的评价结果不存在显著性差异,反之称两组评酒员的评价结果存在着显著性影响因素。当原假设为真时,说明选取的各个指标对评价结果没有显著性影响,在本题中,显然原假设是不成立的,后续的检验将证明这点.2.两因子方差分
15、析的方差分解.(1)误差平方和.每一个观察值与总平均值之间的离差平方和称为误差平方和,记作=其中,称为总均值. (2)行组间误差。双因子误差平方和分解的第一部分,称为行组间误差,记作=(3)列组间误差。双因子误差平方和分解的第二部分,称为列组间误差,记作=(4)组内误差。双因子误差平方和分解的第三部分,称为组内误差,记作=行组间误差衡量的是行因子不同水平之间的差异,列组间误差衡量的是列因子不同水平之间的差异。它们的误差值中既包含随即误差也包含了因子影响的系统误差。所以判断行(列)因子是否有显著性影响,主要考察行(列)组间误差和组内误差之间的差异大小。如果行(列)组间误差和组内误差很接近,就认为
16、行(列)因子无显著性影响。反之,认为行(列)因子有显著性影响。两因子方差分析的检验统计量。其中。根据单因素方差分析推导,有行组间误差服从自由度为的分布列组间误差服从自由度为的分布剩余的列组服从自由度为的分布则两因素方差分析的检验统计量为如下两个:(1) 行检验统计量。(2) 列检验统计量。双因子可重复方差分析的结果判定当显著性水平为时,如果 ,拒绝,说明两组评酒员的评价结果存在显著性差异;等价的值检验是,当值时,拒绝原假设;综合来讲,当,或值 时,拒绝原假设.0-1数据分析在给定条件下,对于有个样品酒来说(红葡萄酒,白葡萄酒),定义函数: (1)其中为每个样品酒的值.给定置信度: (2)对个样
17、品酒的双因子可重复方差检验后,得出值,则认为在置信水平下,两组评酒员的评价结果存在着显著性差异.Alpha模型进行可靠性分析克伦巴赫系数:测度内部一致性的一个指标, 与皮尔逊系数都是一样的范围在01 之间,如果为负值则表明表中某些项目的内容是其他一些项目的反面;越接近于1,则量表中项目的内部一致性越是高,可信度越大.根据量表中的项目数和各项之间的相关系数计算得出当量表中项目增加时,值也会增大;同时,项目之间的相关系数较高时,也会比较大。这里的是指各项与其他各项之和计算相关系数的平均值。模型求解:双因子可重复方差分析模型检验利用Matlab7。6.0的函数对已经预处理的数据进行双因子可重复方差分
18、析,可以得到每个样品酒的检验结果,列举两个检验结果如下所示:提取每个样品酒的所对应值,然后结合公式(1)、公式(2)进行01分析,得到红、白葡萄酒的各个样品酒的如下:图表 Error! Bookmark not defined.模型检验结果红葡萄酒值以及值,得到0。18971 0。00001 0.00040 0。00212 0。16314 0.00138 0。00486 0。00334 0。02476 0.00000 0.00002 0。00011 0.36479 0。21870 011101111111000.00046 0。80100 0.00021 0.56414 0.17544 1。0
19、0000 0.00002 0.04686 0.01131 0.00017 0.00086 0.00112 0.00045 1010001111111白葡萄酒值以及值,得到0。00103 0。00001 0。10777 0.31115 0。50613 0。01060 0.34940 0.67936 0.00329 0。00460 0.00008 0.08585 0。00011 0。20310 110001001110100.01714 0.03333 0。01381 0.19476 0.00339 0.44078 0.00034 0.00005 0。68334 0.46710 0。00031 0
20、.16632 0.13648 0。00001 11101011001001模型结果分析分析图标3的结果,可以知道,对于红葡萄酒来说,对27个葡萄酒样品评分检验中,有70。3%的评价结果中,两组评酒员的评价结果存在着显著性差异(置信水平为95%)。对于白葡萄酒的28个葡萄样品评分的检验,只有53的评价结果中,两组评酒员的评价结果存在显著性检验(置信水平为95).这样的结果,符合之前问题分析中,各个组队样品酒的评分均值差异图。即:两组评酒员对红葡萄的评分结果更具有显著性差异,而对于白葡萄酒的评分,两组评酒员的评价差异性较不明显。Alpha模型的可靠性分析1. 利用SPSS19.0进行可靠性统计量对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学生 数学 建模 竞赛
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。