全国大学生数学建模竞赛题葡萄酒的评价答案剖析.doc

上传人:坚持 文档编号:2100745 上传时间:2019-04-25 格式:DOC 页数:27 大小:888KB
下载 相关 举报
全国大学生数学建模竞赛题葡萄酒的评价答案剖析.doc_第1页
第1页 / 共27页
全国大学生数学建模竞赛题葡萄酒的评价答案剖析.doc_第2页
第2页 / 共27页
全国大学生数学建模竞赛题葡萄酒的评价答案剖析.doc_第3页
第3页 / 共27页
全国大学生数学建模竞赛题葡萄酒的评价答案剖析.doc_第4页
第4页 / 共27页
全国大学生数学建模竞赛题葡萄酒的评价答案剖析.doc_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、1数学实验计算机科学与技术成员:xxx学号:xxxxxxxxxx2葡萄酒的评价摘要本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。在问题一中,我们采用 T 检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过 T 检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用 M

2、atlab 软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用 Matlab 软件

3、进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。关键词:T 检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析3一 问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄

4、酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件 1 给出了某一年份一些葡萄酒的评价结果,附件 2 和附件 3 分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?附件 1:葡萄酒品尝评分表(含

5、 4 个表格)附件 2:葡萄和葡萄酒的理化指标(含 2 个表格)附件 3:葡萄和葡萄酒的芳香物质(含 4 个表格)二 基本假设与符号说明2.1 基本假设(1)评酒员的评分是客观公正的,不受任何外界因素影响。(2)用来检验的葡萄都是刚采摘的新鲜葡萄,葡萄酒也没有遭受任何污染。(3)在检测酿酒葡萄和葡萄酒的理化指标的过程中,忽略由于人为操作不当带来的误差。(4)由于不是每组数据都对葡萄酒的质量产生很大影响,所以在处理数据过程中,忽略那些影响不是很明显的理化 指标。42.2 符号说明第 组评酒员对各品种红葡萄酒的评分均值的期望)2,1(ii第 组评酒员对各品种红葡萄酒的评分均值的方差 i问题一的假设

6、H第 个主成分iZi第 个评酒员对第 种酒的评分jr j三 问题的分析针对问题一,如何判断两组评酒员的评价结果有无显著性差异,我们采用 T 检验法进行判断。但采用 T 检验法的前提是其必须服从正态分布,方差未知且相等。所以我们先对那些数据进行正态分布检验,判断其是否服从正态分布。验证服从正态分布后,我们利用 T 检验法判断两组评酒员评价结果的显著性差异。对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。针对问题二中如何根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,

7、我们采用主成分分析法。因为在实际问题的研究中,往往会涉及众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造” ,用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。解决这个问题的过程中,我们用 Matlab 软件实现主成分分析,我们对那些理化指标进行重新整理,求出各个理化指标的之间的相关系数、特征值及特征向量和贡献率等。

8、针对问题三中如何分析酿酒葡萄与葡萄酒的理化指标之间的联系,我们想到了用多项式曲线拟合的方法,根据两者理化指5标实测样本,用统计分析的方法,找出一种适当的函数关系从而达到处理酿酒葡萄与葡萄酒之间相关关系的目的。实际的操作过程中,我们首先构造一个关于酿酒葡萄与葡萄酒的理化指标的函数,以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量,利用 Matlab 软件进行曲线拟合,得出酿酒葡萄与葡萄酒的理化指标之间的关系。针对问题四中如何分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,以及能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,我们采用无交互作用的双因素试验的方差分析方法。用方差分析,可以

9、将影响葡萄酒的主要因素和次要因素区分开来,还可以分别算出酿酒葡萄的理化指标和葡萄酒的理化指标与葡萄酒质量之间的误差,如果误差在可接受范围之内,即说明可以用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒质量。四 模型的建立与求解4.1 问题一的模型建立与求解4.1.1 T 检验法的模型建立与求解T 检验是用 T 分布理论来推论差异发生的概率,从而比较两个均值的差异是否显著。由于检验红葡萄酒与白葡萄酒的方法和模型一样,这里我们只给出检验红葡萄酒的模型。1. 正态分布的检验由于使用 T 检验法的前提是两个总体分布都服从正态分布,我们先利用 Excel 软件计算出:第一组评酒员对各品种红葡萄酒的评分均值为:6

10、2.7,80.3,80.4,68.6,73.3,73.2,71.5,72.3,81.5,74.2,70.1,53.9,74.6,73,58.7,74.9,79.3,59.9,78.6,78.6,77.1,77.2,85.6,78,69.2,73.8,736第二组评酒员对各品种红葡萄酒的评分均值为:68.1,74,74.6,71.2,72.1,66.3,65.3,66,78.2,68.8,61.6,68.3,68.8,72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2,72, 71.5然后我们利用 Matlab 软件里的正态分布

11、拟合函数进行曲线拟合,得出其正态分布的拟合曲线图为图一:图一、正态分布拟合曲线图从图中我们知道其曲线近似为一条直线,因此我们认为评酒员对红葡萄酒以及白葡萄酒的评分均值都服从正态分布。2. T 检验法模型的建立与求解设 , 分别为第一组、第二组评酒员对各品种红葡萄酒的评分均值,且, ,其中 均未知。),(21N),(2N212,(1) 作出统计假设 。1210:H(2) 选取统计量 )(221211 ntnnST7(3) 对于给定的显著性水平 ,我们利用 Matlab 软件进行计算求解。结果如05.下表所示: 葡萄酒的品种 H 值 P 值 差异显著程度第一组 红葡萄酒第二组 红葡萄酒 0 0.9

12、396 差异不显著第一组 白葡萄酒第二组 白葡萄酒 1 1.4077e-006 差异非常显著H=0,表示接受原假设;H=1,表示接受背择假设。由上表可知:红葡萄酒之间不存在显著性差异,白葡萄酒之间存在显著性差异。4.1.2 可信度的判定由于样本的置信区间与其可信度是呈负相关的,即置信区间越小,其可信度越大。我们利用 Matlab 软件求解得出第一组、第二组红葡萄酒和白葡萄酒的置信区间,见下表:葡萄酒的置信区间红葡萄酒的置信区间 白葡萄酒的置信区间第一组 70.3377,75.7734 72.3342,76.1872第二组 69.6890,71.9607 75.3788,77.6855显然第二组

13、的置信区间长度小于第一组,所以第二组评酒员的评价结果可信度更高。4.2 问题二的模型建立与求解主成分分析法是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I 个变量就有 I 个主8成分。1.计算相关系数矩阵(1)ppprrrrR 212112在(1)式中, 为原变量的 与 之间的相关系数,其计算公式为),(ji ixj(2)nknkjjiikjkjiiij xxr1122)()(

14、因为 R 是实对称矩阵(即 ) ,所以只需计算上三角元素或下三角元素即可。jiijr2.计算特征值与特征向量首先解特征方程 ,通常用雅可比法求出特征值 ,并使其0RI ),21(pi按大小顺序排列,即 。然后分别求出对应于特征值 的特征向量21p i。这里要求 =1,即 ,其中 表示向量 的第 个分量。),21(pieie12jieijeiej3.计算主成分贡献率及累计贡献率贡献率:第 个主成分方差在全部方差中所占的比重称为贡献率。这个值越大,表i明第 个主成分综合信息的能力越强。i主成分 的贡献率为iZ(3)),21(1pipki 累积贡献率:前 个主成分共有多大的综合能力,用这 个主成分的

15、方差和在全部k9方差中所占的比重来描述,表明取前 个主成分基本包含了全部测量指标所具有信息k的百分率。累计贡献率为(4)),21(1pipkik一般取累计贡献率达 的特征值 所对应的第一、第二,%958m,21第 个主成分。)(pm4.计算主成分载荷主成分载荷是反映主成分与元变量之间的相互关联程度。其计算公式为(5)),21,(),( pjiexzpljiij 于是 Matlab 软件求解,分别得出红葡萄与白葡萄所分的主成分、特征值、贡献率以及累计贡献率,结果见下表一及表二:表一 红葡萄主成分的特征值、贡献率及累计贡献率主成分 特征值 贡献率/% 累计贡献率/%1Z25.3328 93.83%

16、 93.83%20.904936 03.35% 97.18%30.642733 2.38% 99.56%4Z0.0717938 0.27% 99.83%50.0237808 0.09% 99.92%60.0109601 0.04% 99.96%7Z0.00684844 0.03% 99.99%80.00376027 0.01% 100%10由上表可看出,主成分 所占的累计贡献率已高达 93.83%(大于 85%) ,故只需求1Z出第一主成分 即可。1Z对于特征值 25.3328 求出其特征向量 ,再用公式计算各变量 ,在主1e ,321x成分 上的载荷为 :1)(iH0.9351,0.9791

17、,0.9611,0.9878,0.9830,0.9812,0.9920,0.9101,0.9958,0.9837,0.9873,0.9877,0.9828,0.8736,0.9924,0.9834,0.9837,0.9911,0.9925,0.9877,0.9661,0.9921,0.9981,0.9781,0.9866,0.7914,0.9420第一主成分 与 都呈现正相关性。1Z,32x因此我们认为:载荷 =0.9981 的 (即果穗质量)与主成分 有极强的正相关。所以,我们)(iH23 1Z根据 的含量水平为葡萄进行排名:排名如下23x样品编号 果穗质量/g红葡萄样品 26 793.47

18、红葡萄样品 24 517.45红葡萄样品 5 515.46红葡萄样品 17 446.64红葡萄样品 20 307.14红葡萄样品 25 288.69红葡萄样品 27 282.09红葡萄样品 23 278.75红葡萄样品 10 255.44红葡萄样品 8 213.09红葡萄样品 14 209.11红葡萄样品 6 202.24红葡萄样品 18 196.01红葡萄样品 12 191.95红葡萄样品 9 186.62红葡萄样品 1 182.93红葡萄样品 11 177.83红葡萄样品 19 173.09红葡萄样品 13 159.97红葡萄样品 15 159.31红葡萄样品 21 147.66红葡萄样品 4 137.97红葡萄样品 16 119.17

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 试题真题

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。