1、封 面院校:湖南理工学院题目:畅 销 品 问 题队员:杨洁 熊翠文 张志畅销品判断摘要 :解决这道题我们使用SPSS软件与matlab软件进行分析。 。主要采用以下两种方法,方法一:贝叶斯判断法,进行系数的判定。该模型构造了类别与商品的式样、包装和耐久性之间的线性关系函数,并由得到的函数判断新厂家产品的得分情况,判断产品是否受欢迎。方法二:classify函数判别法,在 matlab软件中用已有的classify函数直接进行判定,该方法操作简便不但能明确的反映各个影响因素之间的关系,而且能快速判断产品的。且利用判别分析法,可预测到产品所属概率型。关键字:聚类分析 贝叶斯判断 信度分析目 录一、
2、问题重述与分析 .41.1 问题重述 .41.2 问题分析 .4二、模型建立求解与分析 .42.1 模型假设 .42.2 符号说明 .52.3 模型建立 .52.4 模型求解 .5三、模型评价与改进 .73.1 模型分析与评价 .73.2 误差分析 .83.3 模型改进 .9四、参考文献 .10一、问题重述与分析1.1 问题重述某种产品的生产厂家有 12 家,其中 7 家的产品受消费者欢迎,属畅销品,定义为 1 类;5 家的产品不受欢迎,属滞销品,定义为 2 类。将 12 家的产品的式样,包装和耐久性进行了评估后得分如下:厂家 1 2 3 4 5 6 7 8 9 10 11 12式样 9 7
3、8 8 8 9 7 4 3 6 3 1包装 8 6 7 5 9 9 5 4 6 3 4 2耐久性 7 6 8 5 7 3 6 4 6 3 5 2类别 1 1 1 1 1 1 1 2 2 2 2 2今有一新厂家,得分为(6,4,5) ,该产品是否受欢迎。分析已给出的数据,并根据新厂家的产品的各项得分判断该厂家的产品是畅销品还是滞销品。1.2 问题分析本题讲述的是畅销品判断问题,这道题所要解决的问题是日常生活中常见的问题,无论是商家还是顾客都很关注商品的畅销问题。一般的,商品是否畅销取决于商品的式样、包装和耐久性,这三个方面既是吸引顾客的主要因素,也是商品好坏的评判标准。本题给出实际问题的可能影响
4、因素,并给出实际数据供我们分析,得出判断的函数。并由得到的函数判断新厂家产品的得分情况,判断产品是否受欢迎。二、模型建立求解与分析2.1 模型假设从表格中可以看出有三个因素影响着类别的判断,故作出如下假设:1 三个因数中由某个或多个对产品是否畅销起作用,不考虑其它因数2 给出的数据是准确的没有记录错误2.2 符号说明x1:表示式样得分 x2:表示包装得分 x3:表示耐久性得分a:表示 x1 系数 b:表示 x2 系数 c:表示 x3 系数 d:常数项z1:表示产品为畅销品的判别函数 z2:表示产品为滞销品的判别函数2.3 模型建立根据模型假设中的分析则建立式样、包装、耐久性对产品为畅销品或是滞
5、销品的一次线性函数关系,其形式如下:畅销品判断函数 (1)31211 dx*cbx*az滞销品判断函数 (2)22.4 模型求解方法一:贝叶斯判断法打开 SPSS 软件将表格中的数据录入表格中,并保存生成文件 cxp.sav,对数据文件进行聚类分析,对数据进行 Univaritate ANOVAs 单变量方差或者 Boxs M 的描述性统计,函数系数用贝叶斯判断,在对数据进行统计分析时函数系数选择 Fishers 方法得到先验概率表如下Prior Probabilities for Groups.500 7 7.000.500 5 5.0001.000 12 12.0001.002.00Tot
6、alPrior Unweighted WeightedCases Used in Analysis表(1)其中类别 1 和类别 2 的先验概率均为 0.5当对数据进行 K_Means 分析时得到两类中的各个因素凝聚点的值如下图所示:Final Cluster Centers8.00 3.837.00 3.836.00 4.171 2Cluster表(2)由贝叶斯线性判别函数得到 和 两函数的各个因素的系数如下表所示:1z2Classification Function Coefficients4.483 1.861.698 .4662.265 1.467-27.862 -7.677(Const
7、ant)1.00 2.00Fishers linear discriminant functions表(3)故得到模型建立函数如下:畅销品判断函数 (3)27.86-x*.50.698x*4.83z 3211 滞销品判断函数 (4)1462使用模型求解实际问题:任意代入(x1,x2,x3)到函数 、z2 中得到两个函数1z值分别 、 ,比较 、 的大小,若 ,则产品为畅销品,若1z21z22z2 故该厂家产品为畅销品。为了测试模型的正确性任意输入其他数据测试模型的正确性:如测试数据(7,5,6)代入到 、z2 两个方程中得到1z=20.5990、 =16.4820,则判断得出该厂家产品为畅销品
8、;1z2z如测试数据(2,3,4)代入到 、z2 两个方程中得到 =-1z1z7.7420、 =3.31102z则判断得出该厂家产品为滞销品。利用判别分析,预测到的结果完全一致。方法二:classify函数判别法用matlab中的classify函数直接求解,文件cxp.m程序如下:clear,clcsample=input(sample=);%输入要测试的产品training=9,8,7;7,6,6;8,7,8;8,5,5;8,9,7;9,9,3;7,5,6;4,4,4;3,6,6;6,3,3;3,4,5;1,2,2;%将表格中的数据按列优先输入group=1;1;1;1;1;1;1;2;2
9、;2;2;2;%将键入每个厂家的产品的分类class=classify(sample,training,group)%用 classify 函数需要测试的产品的分类在命令行输入6,4,5运行结果:class = 1故该厂家产品为畅销品。再输入其它数据如(7,5,6) 、 (2,3,4)分别得出两个数据测试的 class 值为 1 2则判定两个厂家的产品分别为畅销品和滞销品。三、模型评价与改进3.1 模型分析与评价经 SPSS 软件中的分析得到各个因素对于产品畅销与滞销影响的程度如下表所示:Tests of Equality of Group Means.218 35.882 1 10 .000
10、.473 11.144 1 10 .008.690 4.487 1 10 .060WilksLambda F df1 df2 Sig.表(4)其中 wilks Lambda 值越小说明该因素对模型的影响效果就越显著。由表可得式样对产品的畅销与滞销影响效果最明显,包装次之,耐久性影响效果最不显著。另外还可以从另一个角度来分析,式样和包装的 Sig 值均小于 0.05,且式样的 Sig 值最小,故影响效果最明显,包装的 Sig 值稍大,故影响效果较好,耐久性的 Sig 值大于 0.05 故影响效果最不显著。模型中耐久性对产品是畅销品还是滞销品的影响不大,但是由下表所示的 wilks Lambda
11、可知该模型的总体情况还不错。Wilks Lambda.192 14.012 3 .003Test of Function(s)1 WilksLambda Chi-square df Sig.表(5)优点:利用贝叶斯判断法,构造了合理函数,为产品的判定提供了更准确的依据,减少了评价的误差,为消费者和厂家提供了清晰、准确的关系图,有利于产品的综合评定。3.2 误差分析对数据用 SPSS 软件进行方差分析,分析后输出方差表如下所示:ANOVA56.090 1 2.076 11 27.021 .00032.397 1 2.439 11 13.281 .00410.859 1 2.439 11 4.45
12、2 .059Mean Square dfClusterMean Square dfErrorF Sig.The F tests should be used only for descriptive purposes because the clusters have beenchosen to maximize the differences among cases in different clusters. The observedsignificance levels are not corrected for this and thus cannot be interpreted a
13、s tests of thehypothesis that the cluster means are equal.表(6)由表中的 F 值和 Sig 值可以看出式样的 F 值和 Sig 值为 27.021、0.000 和包装的 F 值和 Sig 值为 13.281、0.004 均,而耐久性的 Sig 值为 0.059 大于 0.05,故耐久性对产品是畅销品还是滞销品判断的影响不大反而对模型起到了反面作用,引起较大的误差,降低模型的准确性。用 SPSS 软件做一次信度分析,得到总体内在信度分析表如下:Reliability Statistics.814 3CronbachsAlpha N of
14、 Items表(7)Cronbachs Alpha 值为 0.814,虽然数值大于 0.7 但是不足 0.9,故模型不是很合理。Item-Total Statistics10.83 13.424 .706 .72211.75 21.477 .557 .85211.25 15.295 .789 .614Scale Mean ifItem Deleted ScaleVariance ifItem Deleted CorrectedItem-TotalCorrelation CronbachsAlpha if ItemDeleted表(8)再通过表(8) ,我们看到最后一列,耐久性这个条目被删除后,
15、另外两个的因数层面 系数都有所降低了,说明耐久性对厂品是否畅销没有强烈的相关性。3.3 模型改进改进后方法一:由上模型分析可得耐久性对产品是畅销品还是滞销品的影响程度并不大,所以,只考虑式样与包装对产品是畅销品还是滞销品判断的影响。用 SPSS 软件再做一次聚类分析,只考虑式样和包装两个因素的影响得到函数系数表如下:Classification Function Coefficients4.003 1.5511.507 .990-21.978 -5.210(Constant)1.00 2.00Fishers linear discriminant functions表(9)可得到新的判别函数如
16、下:畅销品判断函数 (5)978.21*50.13.41 xxz滞销品判断函数 (6)92将(6,4,5)代入 、 得到两个值 =8.0680、 =8.0560, 得到该1z 1z2z1z2厂家的产品属于畅销品,受消费者欢迎。当代入(7,5,6)得=13.5780、 =10.5970, 得到该厂家的产品属于畅销品;当代入1z212(2,3,4)得 = -9.4510、 = 0.8620, 得到该厂家的产品属于滞销品。1zz1z2与原模型所得的结果一致。通过判别分析法验证,后验概率型与先验概率型完全一致。改进后方法二:只考虑式样和包装两个因素,文件cxp1.m程序如下:clear,clcsamp
17、le=input(sample=);%输入要测试的产品training=9,8;7,6;8,7;8,5;8,9;9,9;7,5;4,4;3,6;6,3;3,4;1,2;%将表格中的数据按列优先输入group=1;1;1;1;1;1;1;2;2;2;2;2;%将键入每个厂家的产品的分类class=classify(sample,training,group)%用 classify 函数需要测试的产品的分类在命令行输入6,4运行结果:class = 1故该厂家产品为畅销品。再输入其它数据如(7,5) 、 (2,3)分别得出两个数据测试的 class 值为 1 2则判定两个厂家的产品分别为畅销品和滞销品。四、参考文献1陈汝栋 于延荣,数学模型与数学建模,北京.国防工业出版社,2006 年;2唐焕文,数学模型引论,北京. 高等教育出版社,2001;3姜健飞 胡良剑等,数值分析及其 MATLAB 实验,北京.科学出版社,2004年;4高祥宝 董寒青,数据分析与 SPSS 应用,北京,清华大学出版社,2007 年。5薛 薇,SPSS 统计分析方法及应用,北京,电子工业出版社,2004 年。