毕业论文范文——深圳蔬菜质量评价与抽样优化模型的算法实现.docx

上传人:滴答 文档编号:1255215 上传时间:2019-01-19 格式:DOCX 页数:64 大小:1.89MB
下载 相关 举报
毕业论文范文——深圳蔬菜质量评价与抽样优化模型的算法实现.docx_第1页
第1页 / 共64页
毕业论文范文——深圳蔬菜质量评价与抽样优化模型的算法实现.docx_第2页
第2页 / 共64页
毕业论文范文——深圳蔬菜质量评价与抽样优化模型的算法实现.docx_第3页
第3页 / 共64页
毕业论文范文——深圳蔬菜质量评价与抽样优化模型的算法实现.docx_第4页
第4页 / 共64页
毕业论文范文——深圳蔬菜质量评价与抽样优化模型的算法实现.docx_第5页
第5页 / 共64页
点击查看更多>>
资源描述

1、毕业论文深圳蔬菜质量评价与抽样优化模型的算法实现摘要蔬菜销售行业在国民经济中占有不可忽视的地位,而蔬菜安全则是关乎国民健康和国家发展的重中之重。本文以深圳蔬菜抽样体系为研究对象,在 MATLAB、SPSS、SQL 等软件的数据处理基础上,运用指数平滑、模糊层次分析、多维灰聚类、风险矩阵等多种算法,从安全的总指标出发,完成了对深圳蔬菜抽样方法的综合评价与优化。同时,我们建立线性回归、需求预测、曲线拟合等通用模型,实现全部问题的解答。针对问题一,读取整合处理数据;将蔬菜分为八大类填充入库,计算各类蔬菜各月销售比重;通过多维尺度分析法将八类蔬菜聚合为五类;用样本平移法、指数平滑法,拟合填充缺失月份数

2、据;用 EXCEL 绘制各月各类蔬菜销量折线图和全年各类蔬菜销量均值比重饼图;计算农贸市场、批发市场、商场超市、生产基地各渠道销售量所占比重;根据交易记录,计算新加渠道(零售、电商)的销售比重(6.8%,0.3%);分析图表得出结论:绿色蔬菜和瓜豆类蔬菜冬季波动最为明显,全年销量以绿色蔬菜为甚(56.5%),葱蒜类销量最次(0.4%),选择农贸市场(47.0%)和批发市场(32.6% )购买蔬菜的市民最多,因此后续研究应当特别注意上述类别、季节和销售渠道的蔬菜品质。针对问题二,在 SQL 中计算农贸市场(5.450%)、批发市场(2.750%)、商场超市(8.630% )、生产基地(1.480

3、%)四大销售渠道的抽检不合格率(零售和电商的不合格率缺失) ;对各渠道进行打分构造优先关系矩阵,再用 MATLAB 计算六大渠道风险权重;将前四类渠道的权重与不合格率做线性拟合,算得零售(7.270%)、电商 (6.240%)不合格率;利用公式 计算平=6=0=4.804%均不合格率,以及忽略某渠道后剩余渠道不合格率的改变值 ;分析知,超市的蔬菜最危险(8.630%) ,而忽略农贸市场导致的 减少最多(-0.573% ),因此,应对商场和农贸市场的蔬菜质量加强监管;最后用故障树法进行检验。 针对问题三,从三方面分析:对于鲜菜中风险物质成分,采用多维灰聚类法分析,构造了含有五个指标的权重矩阵来判

4、断风险物质的灰度特征,确定了21 个中高风险的鲜菜样本。对样本中出现的频数较高以及危险性较高、超标严重的分析物质进行汇总分析。由此得到深圳市在检测物质的食品安全方面仍存在一定的风险的结论;针对地域因素,通过计算各省样本的抽查合格率对出口省份进行安全性排名,运用 K-聚类分析法综合考虑多种因素将可输出省份分为3 类,可见该市进口蔬菜中存在风险较高者;结合深圳市民的饮食习惯和反季节蔬菜的特性,得出结论:深圳市面临反季节鲜菜以及本地受污染蔬菜风险。针对问题四,按照简单随机抽样原则估计样本量,蔬菜抽样总量为全年11400 批次,每月 950 批次。根据各辖区蔬菜样品不合格率及原蔬菜抽样比例,规定各辖区

5、每月抽样任务;针对不同季节制定八大类蔬菜抽样方案;根据问题一二得到的六类渠道销量及不合格率,规定抽样场所的比例,采用不同抽样方式,农贸市场、生产基地、批发市场采用分层抽样及系统抽样法,零售摊贩采用分级抽样,电商渠道对货源和仓库中的产品以及物流过程、配送过程中抽样。针对问题五,综合前几题的结论,就深圳蔬菜安全问题向市政府提出建议。关键词:深圳蔬菜 模糊层次分析 多维尺度分析 多维灰聚类 指数平滑 K-聚类分析 风险矩阵一、 问题重述1.1 问题背景随着时代发展,人类生活得到了极大的便利。但与此同时,技术手段的不完善、食品抽检方案的不健全、非法分子管制措施的相对缺失,都使得食品安全问题日趋严重。众

6、所周知,民以食为天。蔬菜作为极富营养价值的天然食品,其监督自然不容小觑。而深圳作为近 40 年前改革开放的窗口,以及拥有 2000 多万人口广东第二大城市,其新鲜蔬菜的消费以输入型为主,输入渠道、生产地区、气候条件、管理模式、菜品种类等都具有多样化的特点。因此,它的食品安全监管也更应当提上日程。建立合理有效的深圳蔬菜安全评估模型和抽检方案,将对人类健康和社会稳定提供极大保障。1.2 问题提出上述诸多因素都对传统的蔬菜安全监管工作方法构成新的挑战。附件 1 是深圳市 2017 年食用农产品监测抽检方案。附件 2 是深圳市 2017 年 1-3 月食用农产品监测抽检详细计划。附件 3 是近两年全国

7、蔬菜及其制品抽样检验不合格列表。我们的任务是根据背景材料和收集的数据,建立数学模型回答以下问题:问题一:收集数据,调查、分析深圳市各季节新鲜蔬菜消费种类及不同输入渠道的比例。问题二:评估检验中忽略某些输入渠道的抽样导致的食品安全风险。问题三:基于附件评估深圳新鲜蔬菜食品安全风险。问题四:根据科学的统计推断原理,设计一套深圳市新鲜蔬菜抽样检验方案,以满足不同层面监测工作的需要,提高食品安全防控的效率与质量。问题五:基于你的研究结果给深圳市政府写一封建议信。二、 问题分析问题一要求我们根据附件和自行搜集的资料,提取各个季度深圳各类新鲜蔬菜的消费情况比例,以及各类蔬菜输入渠道的比例。针对该问题,我们

8、首先根据近两年深圳蔬菜质检结果信息,使用 SQL 对搜得数据进行预处理和简单筛查,得出各月份各类蔬菜销售情况表格。再通过相关存储过程的建立,计算各类销售渠道占比。最终,使用样本平移法对所得数据进行检验,使模型更具合理性。问题二要求我们分析各输入渠道的可忽略性极其影响。针对该问题,我们依然利用深圳蔬菜质检报告,基于问题一的结论,通过大量数据在 SQL 数据库中归类分析,计算各渠道蔬菜产品的比重和不合格率。再根据运筹学中的模糊层次分析法,计算各渠道的安全风险权重。接着,通过已有渠道信息散点图的EXCEL 函数拟合,预测新加渠道的不合格率。最后,比较删去特定渠道对总不合格率的影响,得出风险评估结果。

9、问题三要求我们基于附件评估深圳市的新鲜蔬菜食品安全风险。基于深圳市鲜菜的输入性特征,我们将影响新鲜蔬菜食品安全的因数主要分为三类:鲜菜中存在的危险物质带来的物质性风险、生产管理不规范或污染严重区域生产的鲜菜产品带来的地域性风险、生产方式不同以及本地饮食习惯不同带来的其他风险。运用灰度聚类法对未检测危险物质进行分类并且确定具有高度及中度风险的物质,并确定其比例,以对危险物质带来的风险进行评价。对于已检测的物质,我们采用分类汇总和样本描述的方法,以得到已检测物质中出现漏检错检可能存在的风险。对于地域性风险,我们先通过样本的检验不合格率对于全国可能出口的省市进行划分,并通过 K-聚类分析结合铁路距离

10、、平均运价、季节性、是否有出口记录等特性对出口省市进行分类,得出主要出口、次要出口、以及极少出口的各个省市,结合检验不合格率对于鲜菜产品带来的地域性风险进行评估。对于生产方式不同以及本地饮食习惯不同带来的其他风险,结合实际数据以及反季节蔬菜的特性对该类风险进行定性分析,得到其他风险的评价。问题四要求我们根据科学的统计推断原理,设计一套满足不同层面监测工作的需要的深圳市新鲜蔬菜抽样方案,并提高食品安全防控的效率与质量。针对该问题,我们首先分析了现有抽样方案的不足之处,之后采用简单随机抽样的方法估计样本量,依据各辖区新鲜蔬菜样品不合格率及原新鲜蔬菜抽样比例,为各辖区分配具体抽样任务。根据问题一、问

11、题二所得结论,确定不同抽样渠道抽样比例以及不同季节蔬菜抽样比例。不同渠道的抽样采用分层抽样、多阶段抽样、系统抽样、简单随机抽样相结合的方式,以更加全面准确地覆盖区域的情况,提高评价精度。三、 问题模型假设1. 假设所收集数据皆为可靠数据,不存在错误信息。2. 假设质检报告样本中各类蔬菜和输入渠道比例与实际市场蔬菜销售和比例完全相同。3. 假设每一年相同时间蔬菜消费种类、输入渠道比例相同,市民饮食习惯不变,忽略不同年份天气、气候、政策等影响可能带来的差异。4. 假设模型涉及的所有蔬菜所属分类都包含于本文所列八大类中,不存在模糊分类的情况,蔬菜与类型一一对应。5. 假设各城市间铁路长度即为蔬菜运输

12、距离,且各类蔬菜生产省份到深圳的距离均以该省省会城市计算,运价以普通运输价格估计。6. 假设附件中收集的全国数据中的不合格率与全国鲜菜出口样品中的不合格率相同7. 假设鲜菜样品中存在的所有危险物质均包括在全国的检验报告中。8. 假设 2015 年的全国农村统计年鉴中有关于鲜菜产量的数据具有平常性和代表性。9. 假定各个省份的蔬菜抽样比例相同。10. 文中不同渠道运输的温度以及相对湿度都大致相同,而在蔬菜的运输流通环节中,运输的时间越长,蔬菜变质的安全风险越高。11. 在蔬菜生产环节中,各个销售渠道各自获得的蔬菜的品质大体一致。四、 符号说明符号 含义 符号 含义A不安全性评价指标 p平均不合格

13、率1B农药残留 iq第 渠道所占比例i2新鲜程度 0 最小样本量3非法添加 N样本总体数1C农贸市场安全风险 22 正态变量值2批发市场安全风险 Ap不合格率3商场超市安全风险 容许误差4C生产基地安全风险 0(,)fij各因素相对不安全性的优先关系5零售安全风险 k各销售渠道相对因素的优先关系kB6电商安全风险 (,)Rij对应的模糊(,)fij一致阵元素0W层对 层的权重向量BAip第 渠道的蔬菜不合i格率k层对 因素的权重向量CkW总权重向量五、 模型建立与求解5.1 问题一的模型建立与求解5.1.1 问题一的分析本题要求我们收集调查数据,并分析深圳各季蔬菜消费种类及输入渠道比例。针对这

14、一问题,我们给出如下求解思路和具体步骤:步骤一:根据深圳市市场和监督管理委员会给出的官方数据(深圳市蔬菜质量安全监测结果) ,导入 SQL 数据库进行预处理,剔除无用数据和不详数据。步骤二:在已有数据中添加蔬菜的八大分类信息列,通过查询和更新语句进行完全填充。步骤三:利用多维尺度分析法将蔬菜八大类细分为五类。步骤四:使用样本平移法对缺失数据进行估计,再用指数平滑法将数据拟合。步骤五:建立各季节、各月份、各抽样场所(即输入渠道)抽检情况视图,并编写存储过程分别计算相应时段、相应渠道各类别蔬菜占比。步骤六:将所得结果导入 EXCEL,绘制消费折线图和蔬菜类别饼图。5.1.2 菜品样本分类的确定与数

15、据填充查阅原题所给的附件一,易知蔬菜可分为鳞茎类、叶菜类、芸苔属类、瓜类、茄果类、豆类、根茎类、水生类和其他小类。为了数据处理的便捷和结果的合理性,我们对上述种类进行了修正,得到根菜类、鲜豆类、茄果瓜菜类、葱蒜类、嫩茎叶花菜类、水生蔬菜类、薯芋类和野生蔬菜类八大类,具体信息见下表。表 1.1 深圳市蔬菜销售种类 1种类 名称根菜类 白萝卜、青萝卜、胡萝卜等鲜豆类 豌豆、豆芽、荷兰豆等茄果瓜菜类 茄子、番茄、甜椒、黄瓜等葱蒜类 蒜苗、葱等嫩茎叶花菜类 大白菜、上海青、笋、西兰花等水生蔬菜类 莲藕、茭白等薯芋类 山药、姜、芋头等野生蔬菜类 枸杞、香椿等至此,深圳蔬菜消费种类信息已在数据库中补充完毕

16、。5.1.3 基于多维尺度分析方法的蔬菜分类细分考虑到八个种类的规律性和走势的复杂性,在后续处理中可能很难对其进行分析,在此我们使用 SPSS 中的多维尺度分析法对蔬菜类别做进一步细分。经过多方资料的收集,我们认为影响蔬菜种类相似度的因素有如下几种:1. 营养成分:蛋白质、脂肪、淀粉、水、无机盐和维生素六大类;2. 食用器官:根、茎、叶、花、果实和种子六种;3. 生产地域:各高原、平原、江河流域等;4. 可能危害相似度:农药残留、非法添加、微生物、食品添加剂等。以上述指标为细则,我们对已经分好的八类蔬菜进行打分,详见下表:表 1.2 蔬菜相似度评分表根菜类鲜豆类茄果瓜菜类葱蒜类嫩茎叶花菜类水生

17、蔬菜类薯芋类野生蔬菜类根菜类 0鲜豆类 2.517 0茄果瓜菜类 2 1.5 0葱蒜类 2.25 2.58 3 0嫩茎叶花菜类 2.25 2.25 2.75 2.92 0水生蔬菜类 2.77 1.5 2.71 1.67 0.72 0薯芋类 1.33 3 2.63 3.08 2.8 3.17 0野生蔬菜类 3.25 3.42 3.3 2.8 2.05 1.67 3.5 0基于矩阵元素分值越低越相近的原则,此表格可以在概念图中得以直观呈现:图 1.1 蔬菜种类的二维尺度空间概念图本文采取的多维尺度分析法并不同于以图表形式输出结果的其他方法,我们得到的是一系列的数值说明:For matrixStre

18、ss = .13195 RSQ = .88836其中 Stress 值(应力值)为 0.13 说明本次拟合水平(信度)一般, RSQ值为 0.890.60 说明本次拟合通过检验,其效度是可以接受的。综上,我们可将新鲜蔬菜聚合为瓜豆类、葱蒜类、绿色蔬菜类、野生蔬菜类和地下作物类五种:(1) 瓜豆类:茄果瓜菜类+鲜豆类;解释:二者营养成分相似,主要都为糖类和淀粉;且二者的食用部分都是果实。(2) 葱蒜类:葱蒜类;(3) 绿色蔬菜类:嫩茎叶花菜类+水生蔬菜类;解释:二者营养成分都是维生素和矿物质,且食用部分都以根茎叶为主。(4) 野生蔬菜类:野生蔬菜类;(5) 地下作物类:薯芋类+根菜类。解释:二者

19、食用部分都以根茎为主。至此,蔬菜细分完成。5.1.4 缺失数据处理初始数据信息量庞大,且由多个文档整合而成。考虑到后续数据处理的便捷性需求,我们将其导入数据库中,通过查询语句剔除空行和无效列,并增加菜品分类属性列和不同时段不同场所抽检视图,以备后续计算之需。具体过程参见附录。通过软件对数据属性的归类,我们发现 2016 年部分月份的数据处于缺失状态,且特定区段的数据规律性欠佳。我们收集到的数据是深圳市市场和质量监督管理委员会发布的 2016 年 7 月至 2017 年 2 月的深圳市农产品质量安全猪肉和蔬菜例行监测结果 。对于缺失数据,我们采用了移动平均法和指数平滑法,最终,我们采用指数平滑法

20、得到结果。(1) 样本平移法 2我们首先采用了一种根据真实数据构造采样点的方法来解决数据不完整的问题。其基本思想类似于连续函数中的插值,在采样环节中,所采集的样本数据是离散的,因此和连续函数不同,构造出的为样本数据也应该是离散的,并且统计上服从相似形状的分布,称之为“伪样本空间” 。伪样本空间应该满足:样本标志值(被测量值)的概率密度函数和真实样本空间样本标志值具有相似的分布,即概率密度函数的形式不发生变化。采样数据是抽样率很低的随机抽样数据,而且由于蔬菜的季节性、区域性、多样性、差异性,抽样无法得到详细、完整的数据,缺少了三至六月的数据,而蔬菜消费种类的比例随月份有明显的变化,这样会对各季节

21、新鲜蔬菜消费比例的评估造成不良影响。所以,针对三至六月的数据分析采用了样本平移法。我们将广州江南果菜批发市场的每月蔬菜销售情况作为参考,假设其每月蔬菜种类销售变化情况反映深圳市的蔬菜种类销售情况。原因是广州江南果菜批发市场是中国乃至东南亚地区最大的果菜集散地之一,蔬菜交易量一直稳居全国第一,每天的蔬菜成交量达 1000 万公斤,占广州市蔬菜上市量 70%,具有参考性。 根据广州江南果菜市场 2015 年 5 月、2016 年 3 月、4 月、6 月、7 月蔬菜销售情况分析,可以总结得到: 三月,冬储菜的交易步入尾声,新的蔬菜尚未批量上市,市场供应的蔬菜主要以冬储菜为主,其中销量比较大的为大白菜

22、、萝卜、土豆。海南的反季节瓜豆进入盛产期,三月还没到本地和北方瓜豆的上市期。 四月,市场销售量较大的以供应到饭堂的大类蔬菜为主,其中四月销量排名前三的蔬菜有大白菜、土豆、青瓜,其中,青瓜的供应量明显增多,销量提高了三成左右。在换季阶段,市民普遍食用的蔬菜由叶菜类蔬菜逐渐向瓜豆类蔬菜转移。海南瓜豆类上市量减少,到月下旬只有较少的上市量,本地瓜豆在下旬开始少量上市。 五月,市场又开始进入瓜豆类蔬菜的销售旺季。本月销售量最大的蔬菜为土豆、胡萝卜、萝卜、洋葱头、大白菜、椰菜、莴笋、大肉姜、青瓜、南瓜。五月中下旬,高温、多雨、潮湿的天气不利于叶菜类生长,菜叶容易腐烂,叶菜类供应减少。海南瓜豆类上市量将进一步减少,到月底估计只有微量的海南蔬菜上市,来自北方的蔬菜和本地瓜豆类蔬菜,供应量逐渐增加,成为市场销售的主流蔬菜。瓜豆类、茄果类蔬菜供应量越来越多,叶菜类蔬菜供应量越来越少。新产洋葱和新产的土豆也开始大量上市。 六月,销量排名前三的蔬菜有绍菜、椰菜、西红柿,销量环比上涨。北方露天蔬菜进入采收旺季,以瓜豆类为主的蔬菜供应量持续增加,瓜豆类蔬菜价廉物美,是市民最热爱的选择。叶类蔬菜水分较大,在适宜的温度和日照下生长周期缩短,市场供应量增加。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。