葡萄酒的评价数学建模论文.doc

上传人:11****ws 文档编号:3130524 上传时间:2019-05-22 格式:DOC 页数:23 大小:959.50KB
下载 相关 举报
葡萄酒的评价数学建模论文.doc_第1页
第1页 / 共23页
葡萄酒的评价数学建模论文.doc_第2页
第2页 / 共23页
葡萄酒的评价数学建模论文.doc_第3页
第3页 / 共23页
葡萄酒的评价数学建模论文.doc_第4页
第4页 / 共23页
葡萄酒的评价数学建模论文.doc_第5页
第5页 / 共23页
点击查看更多>>
资源描述

1、2012 高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公

2、示,在书籍、期刊和其他媒体进行正式或非正式发表等) 。我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): J0832 所属学校(请填写完整的全名): 西安理工大学 参赛队员 (打印并签名) :1. 薛川川 2. 田 红 3. 李 瑞 指导教师或指导教师组负责人 (打印并签名): 秦新强 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012 高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由

3、赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):- 1 -葡萄酒的评价摘 要本文以酿酒葡萄和葡萄酒为对象,根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,建立了酿酒葡萄与葡萄酒理化指标间的联系,并就酿酒葡萄与葡萄酒理化指标对葡萄酒质量的影响进行了分析讨论。针对问题一,首先用EXCEL软件分别对红白葡萄酒的两组评价结果进行处理,得到其打分分数的平均值,然后考虑到本题确定的两个独立样本的分布形态不确定,所以选用非参数检验中的Mann-Whitney U检验和Kolmogorov- Smirnov检验方法对评价结果进行显著性分析,发现两组评酒员的评价结果有显著性差异

4、,最后分别对两组评分数据求标准差并进行比较,确定出第二组评酒员的评价结果可信度高。针对问题二,我们用聚类分析和主成分分析两种方法对葡萄样品进行分类,并比较两种方法的优劣性。首先用 SPSS 软件中的聚类分析法对葡萄样品进行分类,结果将葡萄分为四类,然后用主成分分析法简化酿酒葡萄的理化指标,并求出简化后理化指标的权重,得出葡萄样品的综合排名,对其进行排序,用建立好的评级指标可以将样品分为如下四类:等级 红葡萄 白葡萄最佳 8,10,14 1,13良好 2,3,5,26 3,5,6,10,15,16,17,20,21,24,27中等 1,6,9,13,17,19,21,23,24,27 2,4,7

5、,8,9,11,12,14,18,19,22,23,25,28差 4,7,11,12,15,16,20,22,25,28 26最后通过对两种方法的比较,得出主成分分析法为较优方法。针对问题三,首先根据问题二中主成分分析法的结果对酿酒葡萄的指标进行简化,将问题转化为一个多元函数的求解问题,然后分别对酿酒葡萄中的指标和葡萄酒理化指标进行相关性分析,得出指标间的相关性关系,将问题转化为求解超定方程组的解,最后利用最小二乘法建立了酿酒葡萄与葡萄酒理化指标间的关系式。针对问题四,首先把评酒员对酒样品的评分作为葡萄酒质量的评价,用相关性分析方法求出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量之间的相关性,然后再

6、把芳香度作为葡萄酒质量的评价,求出理化指标与葡萄酒质量之间的相关性,对比这两种方法的结果可以得出结论:在一定程度上不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:非参数检验 聚类分析法 主成分分析法 相关性分析- 2 -一 问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件 1 给出了某一年份一些葡萄酒的评价结果,附件 2 和附件 3 分别给出了该年份这些葡萄酒的和

7、酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二 问题分析对于问题一,要想得到差异的显著性,首先就要处理数据得到两组评价结果的平均值,但考虑到两个独立样本的分布形态不确定,所以用非参数检验法更加准确。针对这个问题,我们采用最常用的两种方法:Mann-Whitney U 检验和 Kolmogorov

8、- Smirnov 检验来判断是否有显著性差异。对于可信度,考虑到标 准 差 是 反 应 一 组 数 据离 散 程 度 最 常 用 的 一 种 量 化 形 式 , 是 表 示 精 确 度 的 重 要 指 标 , 可 以 反 映 组 内 个 体 间的 离 散 程 度 , 所 以 采 用 标 准 差 值 的 大 小 来 衡 量 测 量 结 果 的 可 信 度 。 对 于 问 题 二 , 我们可以用聚类分析对葡萄样品进行分类,也可以用主成分分析求出主要的影响指标及其权重,进而对样品进行排序并分类。最 后 通 过 对 比 两 种 方 法 的优 劣 性 得 出 较优方法,从而得到葡萄的质量分级。对于问题

9、三,由于酿酒葡萄的指标很多,所以首先应该对酿酒葡萄的指标进行简化将问题转化为一个多对多的模型,然后分别对酿酒葡萄中的指标和葡萄酒理化指标进行相关性分析,得出指标间的相关性关系,将问题转化为求解超定方程组的解,最后可以利用最小二乘法建立酿酒葡萄与葡萄酒理化指标间的联系。对于问题四,首先根据问题三的结果可以将酿酒葡萄和葡萄酒的理化指标进行进一步的简化,然后把评酒员对酒样品的评分作为葡萄酒质量的评价,用 软件中的SP相关性分析方法求出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量之间的相关性,就可以得出他们之间的影响程度,然后再把芳香度作为葡萄酒质量的评价,求出理化指标与葡萄酒质量之间的相关性,对比这两种方

10、法的结果来论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。三 模型假设1.假设酿酒葡萄和葡萄酒是一一对应的关系;2.假设葡萄酿酒过程中的卫生指标符合规定,本题不予以考虑;3.假设评酒员在评分时不受其他主观因素的影响;4.假设酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系;5.假设两组评酒员都是随机选取的;- 3 -6.为了便于问题解决,假设酿酒葡萄和葡萄酒的理化指标属于线性关系;7.芳香物质是葡萄酒质量的重要指标,文中将芳香物质摩尔总和用于评价葡萄酒质量。四 符号说明符号名称 符号意义P双侧显著性水平显著水平xF理论葡萄酒累积频数分布n次观测的随机样本的经验分布函数nD检验统计量F综合主成分

11、值ix红葡萄酒的理化指标iy红葡萄的指标ix白葡萄酒的理化指标iy白葡萄的指标五 模型的建立与求解5.1 问题一求解本文首先分析了影响评酒员对葡萄酒进行评价的相关因素,发现他们是从外观、香气和口感等方面来对白葡萄酒和红葡萄酒的各样本进行打分的,为了综合这些因素,能够更好地比较出两组评分结果的差异性与可信度,需要对附件 的数据进行处理,这1里我们分别求出第一组和第二组评酒员对白葡萄酒和红葡萄酒打分分数的平均值。处理的数据见表 1.1.1,表 1.1.2,表 1.1.3,表 1.1.4:表 1.1.1:第一组红酒各样品分数平均值样品 1 2 3 4 5 6 7 8 9平均值 62.7 80.3 8

12、0.4 68.6 73.3 72.2 71.5 72.3 81.5样品 10 11 12 13 14 15 16 17 18平均值 74.2 70.1 53.9 74.6 73 58.7 74.9 79.3 59.9样品 19 20 21 22 23 24 25 26 27平均值 78.6 79.8 77.1 77.2 85.6 78 69.2 73.8 73表 1.1.2:第二组红酒各样品分数平均值样品 1 2 3 4 5 6 7 8 9- 4 -平均值 68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2样品 10 11 12 13 14 15 16 17 18

13、平均值 68.8 61.6 68.3 68.8 72.6 65.7 69.9 74.5 65.4样品 19 20 21 22 23 24 25 26 27平均值 72.6 75.8 72.2 71.6 77.1 71.5 68.2 75 71.5表 1.1.3:第一组白酒各样品分数平均值样品 1 2 3 4 5 6 7平均值 82 74.2 78.3 79.4 71 68.4 77.5样品 8 9 10 11 12 13 14平均值 71.4 72.9 74.3 72.3 63.3 65.9 72样品 15 16 17 18 19 20 21平均值 72.4 74 78.8 73.1 72.2

14、 77.8 76.4样品 22 23 24 25 26 27 28平均值 71 75.9 73.3 77.1 81.3 64.8 81.3表 1.1.4:第二组白酒各样品分数平均值样品 1 2 3 4 5 6 7平均值 77.9 75.8 75.6 76.9 81.5 75.5 74.2样品 8 9 10 11 12 13 14平均值 72.3 80.4 79.8 71.4 72.4 73.9 77.1样品 15 16 17 18 19 20 21平均值 78.4 67.3 80.3 76.7 76.4 76.6 79.2样品 22 23 24 25 26 27 28平均值 79.4 77.4

15、 76.1 79.5 74.3 77 79.6根据不同组评酒员针对不同品种和样本葡萄酒的打分情况,可以将这两组的打分情况看作两个独立的样本。这样就将问题转化为求两独立样本的参数检验问题。利用T检验方法可以得到两个总体是否存在显著性差异,但T检验方法要求两个独立样本来自的总体服从正态分布,甚至对两个总体的方差也要求相等或者已知。所以我们利用两独立样本的非参数检验过程对两个总体的分布是否存在显著性差异进行检验。由于非参数检验的方法比较多,这里主要运用Mann-Whitney U 检验和Kolmogorov- Smirnov检验两种方法,并给出不同检验的相关结果。1. Mann-Whitney U检

16、验Mann-Whitney U检验可用于检验两独立样本是否来自于同一总体,它是最常用的两独立的非参数检验方法,该检验方法的零假设是这种检验方法是利用两独立样本的秩的比较得到的。它的检验步骤为:(1) 提出假设:两样本来自于无显著差异的总体0H两样本来自于有显著差异的总体(2) 计算相应检验统计量值或 值P(3) 作出判断- 5 -若 ,接受 ,认为两个样本无显著性差异;否则,拒绝 ,认为两个样本有P0H0H显著性差异( 值为双侧显著性水平, )。05.分别将表1.1.1和表1.1.3、表1.1.2和表1.1.4的数据导入SPSS软件运用Mann-Whitney U检验得到红葡萄酒和白葡萄酒的秩

17、和检验统计量,如表 1.1.5和表1.1.6所示:表1.1.5:红葡萄酒检验的秩和检验统计量秩g N 秩均值 秩和1.00 27 32.69 882.502.00 27 22.31 602.50sur总数 54表1.1.6:白葡萄酒检验的秩和检验统计量从表1.1.5和表1.1.6可以看出,两种葡萄酒的 值均小于0.05,所以拒绝 ,认为P0H两个样本即两组评价结果有显著性差异。2. Kolmogorov- Smirnov(K-S)检验Kolmogorov- Smirnov 检验用于检验一组样本观测结果的经验分布同某一指定的理论分布之间是否一致。K-S 检验的基本思路为:将顺序分类数据的理论积累

18、频率分布同观测的经验累积频率分布加以比较,求出它们最大的偏离值,然后再给定的显著性水平上检验这种偏离值是否是偶然出现的。设理论葡萄酒累积频数分布为 , 次)(xFn观测的随机样本的经验分布函数 ,K-S 检验的步骤如下:)(xFn(1) 零假设 :经验分布与理论分布没有显著差别。0H(2) 把样本观测值从小到大排列为: ,计算经验累积分布函数:nx,21 ,11ixnixFniin 检验统计量 bsurMann-Whitney U 224.500Wilcoxon W 602.500Z -2.422渐近显著性(双侧) .015显著性 .000a下限 .000Monte Carlo 显著性(双侧)

19、 95% 置信区间上限 .105显著性 .000a下限 .000Monte Carlo 显著性(单侧) 95% 置信区间 上限 .105秩g N 秩均值 秩和1.00 28 23.79 666.002.00 28 33.21 930.00sur总数 56检验统计量 asurMann-Whitney U 260.000Wilcoxon W 666.000Z -2.163渐近显著性(双侧) .031a. 分组变量: g- 6 -和理论累积分布函数 。xF记检验统计量 ,K-S检验将计算 值以及相应nixDiin ,21|)(|ma D的概率 值。在给定显著性水平的条件下,如果概率 值小于显著性水平

20、,则拒绝零P P假设,认为两样本有显著性差异,反之,则没有显著性差异。分别将表1.1.1和表1.1.3、表1.1.2和表1.1.4的数据导入SPSS软件运用Kolmogorov- Smirnov检验得到红葡萄酒和白葡萄酒的频率(频数)和检验统计量,如表1.2.1和表1.2.2所示:表1.2.1:红葡萄酒检验的频率和检验统计量频率g N1.00 272.00 27sur总数 54表1.2.2:白葡萄酒检验的频率和检验统计 量频率g N1.00 282.00 28sur总数 56这里给出显著性水平 =0.06,从上面的表格可以看出,概率 值均小于显著性水P平,所以拒绝零假设,认为两组结果有显著性差

21、异。通过上面两种检验方法,可以得出结论:两组评酒员的评价结果均有显著性差异。3.可信度的评判 对于可信度,我们用标准差进行评判。因为标 准 差 是 反 应 一 组 数 据 离 散 程 度 最 常用 的 一 种 量 化 形 式 , 是 表 示 精 确 度 的 重 要 指 标 , 可 以 反 映 组 内 个 体 间 的 离 散 程 度 ,即 标准差小的表示数据的波动小,离散程度低,稳定性高,可信度高。反之,则离散检验统计量 bsur绝对值 .407正 .111最极端差别负 -.407Kolmogorov-Smirnov Z 1.497渐近显著性(双侧) .023显著性 .000a下限 .000Mo

22、nte Carlo 显著性(双侧)95% 置信区间上限 .105a. 基于 27 个具有起始种子 334431365 的采样表。b. 分组变量: g检验统计量 asur绝对值 .357正 .357最极端差别负 -.071Kolmogorov-Smirnov Z 1.336渐近显著性(双侧) 0.056a. 分组变量: g- 7 -程度高,稳定性低,可信度小。结合表 1.1.1、表 1.1.2、表 1.1.3 和表 1.1.4 的数据进行计算,得出两组评酒员对葡萄酒的评价结果的标准差,见表 1.3.1。表 1.3.1 两种葡萄酒评价的标准差红葡萄酒 白葡萄酒第一组 第二组 第一组 第二组标准差

23、7.38 3.98 4.80 3.17由表 1.3.1 的数据中可以看出,第二组评价结果的标准差均小于第一组,所以认为第二组的可信度高。5.2 问题二的求解在处理此问题前,首先要对问题所给的数据(附件 1,附件 2)进行分析处理。通过对葡萄理化指标资料的查找知道白藜芦醇由反式白藜芦醇,顺式白藜芦醇,反式白藜芦醇苷和顺式白藜芦醇苷等物质组成;黄醇酮由杨梅黄铜,槲皮素,山奈酚和异鼠李素组成;氨基酸由苏氨酸,丝氨酸等氨基酸组成;还原糖由葡萄糖和果糖组成,同时又因为我们通过对题目所给的二级指标数据求和后,与一级指标数据进行比较发现其值相同,故最终认为建模中我们只需考虑一级指标的理化性质即可。接着根据附

24、件 2 给出的色泽中 的数据,结合查找出的公式:CHbaL,*色泽饱和度 ,2色调角 ,*arctn葡萄和葡萄酒的颜色指标为 ,CLI180可以求出酿酒葡萄所对应的颜色指标,如下表 2.1.1,表 2.1.2 所示。表 2.1.1:红葡萄的颜色指标样品 1 2 3 4 5 6 7 8 9颜色指标 7.08 6.55 6.79 8.35 6.78 6.04 6.73 6.54 7.18样品 10 11 12 13 14 15 16 17 18颜色指标 6.15 4.33 7.49 6.11 6.82 5.53 6.91 6.54 4.75样品 19 20 21 22 23 24 25 26 27

25、颜色指标 6.52 6.65 6.47 7.41 6.59 6.83 6.28 6.17 6.01表 2.1.2:白葡萄的颜色指标样品 1 2 3 4 5 6 7颜色指标 3.75 3.49 3.55 2.89 2.92 3.35 3.18样品 8 9 10 11 12 13 14颜色指标 4.16 3.49 3.42 3.18 3.66 3.63 3.12样品 15 16 17 18 19 20 21颜色指标 3.74 4.19 3.08 3.40 4.46 3.26 3.06- 8 -样品 22 23 24 25 26 27 28颜色指标 3.78 3.05 3.47 3.87 3.23

26、3.19 2.81又因为葡萄酒质量包括理化指标和感官指标,其中芳香物质属于感官指标,所以需要根据附件 3 对葡萄酒的芳香物质数据进行处理,如表 2.1.3,表 2.1.4 所示:表 2.1.3:红葡萄酒样品芳香物质的平均摩尔数样品 1 2 3 4 5 6 7 8 9摩尔数 4.91 456 3.82 3.55 3.89 4.63 3.24 3.94 3.55样品 10 11 12 13 14 15 16 17 18摩尔数 2.87 2.51 4.41 3.57 2.05 4.42 3.37 4.53 3.73样品 19 20 21 22 23 24 25 26 27摩尔数 3.56 3.27

27、3.69 5.16 3.83 4.65 2.96 3.2 4.51表 2.1.4:白葡萄酒样品芳香物质的平均摩尔数样品 1 2 3 4 5 6 7摩尔数 4.39 3.19 7.43 4.42 3.75 4.73 2.37样品 8 9 10 11 12 13 14摩尔数 4.18 8.09 4 3.2 2.46 2.29 7.18样品 15 16 17 18 19 20 21摩尔数 3.78 1.34 5.41 2.52 4.46 6.57 4.82样品 22 23 24 25 26 27 28摩尔数 5.69 5.53 6.35 5.25 2.76 5.94 4.77在问题二中葡萄酒的质量可

28、选用评酒员对每种样品酒打分的分数平均值作为标准,由于问题一分析的第二组数据的可信度较高,所以分别选用红白葡萄酒评价的第二组数据进行分析,即表 1.1.2,表 1.1.4。最后,根据对数据的处理,综合表 1.1.2,表 1.1.4,表 2.1.1,表 2.1.2,表2.1.3,表 2.1.4,附件 2,可以得到关于酿酒葡萄理化指标与葡萄酒质量的综合数据表,见附录 1,附录 2。对于问题二,需要对酿酒葡萄进行分级。考虑到影响酿酒葡萄的因素包括葡萄自身多种的理化性质,还有所酿成葡萄酒的标准对葡萄的要求等,为了分析各种因素之间的关系并对其进行分类,本文我们分别选用聚类分析法和主成分分析法处理此问题。1

29、.聚类分析法聚类分析法是理想的多变量统计技术,主要有分层聚类和迭代聚类法。聚类分析也称群分析、点群分析,是研究分类的一种多元统计方法。根据附录 1,附录 2,分别将数据导入 软件,运用分层聚类法分别得到红白葡萄理化性质和与其对应的葡萄SP酒质量的群集成员表(见表 2.2.1,表 2.2.2)和树状图(见图 2.2.1,图 2.2.2):表 2.2.1:红葡萄群集成员表案例 1:1 2:2 3:3 4:4 5:5 6:6 7:7 8:8 9:94 群集 1 1 2 3 3 3 3 1 1案例 10:10 11:11 12:12 13:13 14:14 15:15 16:16 17:17 18:18

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 精品笔记

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。