1、学 号: 题目类型: 论文 (设计、论文、报告 )本 科 毕 业 设 计 (论 文 )题目:在线用户团购行为的统计分析以广东省为例学 院: 理 学 院 专业(方向): 统 计 学 班 级: 学 生: 指 导 教 师 : I摘 要伴随着互联网在中国的普及和中国电子商务的繁荣发展,网络团购在国内网民中流行起来,并成为 2011 年增长第二快的网络服务。而在网络团购急剧膨胀的过程中,团购网站同质化竞争激烈,用户体验不佳、商家倍受诟病等问题层出不穷。团购网站如何脱颖而出?到底有哪些因素影响着网络团购的健康持续发展?本文就广东在线用户团购行为的网上问卷数据进行分析,通过判断在线用户目前的团购状态、未来消
2、费意愿等特征,划分为潜在消费者与现有消费者两类群体,进行以下分析:首先,运用描述性统计方法研究其各自在年龄、性别、收入、职业、学历等基本特征,进行人口统计细分,得到团购的主要消费人群及这两群体基本特征;其次,运用因子分析和聚类分析,以在线用户的生活与购物态度作为细分变量,对在线用户进行市场细分,通过列联表分析可以看出目前几大受欢迎团购网站并没有明确的市场细分;再次,运用描述性统计方法分析其用户行为和购买需求:在选择团购网站、产品与服务、网络应用,以及能影响决策的团购广告形式等方面有何特点和差异,预测其市场前景;最后,运用满意度分析和列联表分析,找出网络团购中存在的问题与弊端。通过以上分析,了解
3、在线用户的一系列团购行为特征,给予团购网站与商家意见和建议,帮他们指明方向。关键词: 互联网;团购;因子分析;聚类分析;满意度;交叉列联表IIThe Statistical Analysis of the Group-Buying Behaviors of Online UsersTaking Guangdong Province as an ExampleAbstract: With the popularization of Internet and the boom of e-business in China, the online group-buying, which is ubi
4、quitous in Chinese Internet users, ranks the second place in the Chinese Internet services. In the rapid development of online group-buying, there are many similar websites offering this service, and the competition is necessarily violent. On the other hand, the problems, such as the low service sat
5、isfaction level and the irresponsibility of the providers, emerge inexhaustibly. How can these websites grasp the opportunity and stand out? What on earth will have negative impacts on the sustainable developmental environment of online group-buying?According to the network questionnaire data about
6、the Internet users online group-buying behaviors in Guangdong Province, I divide these users into potential customers and actual customers by judging the current buying status, the future consuming willingness and other characteristics, and carry out the following analysis:First of all, the basic ch
7、aracteristics of these two groups of people are obtained with the descriptive statistical method used to study the differences in age, gender, income, profession and education. Secondly, with statistical methods such as factors analysis and cluster analysis, using the online users attitude in life a
8、nd shopping as segmented variable, the customer market of online group-buying is segmented. Through the crosstabs, I find that the most popular websites have no specific market segmentation. Thirdly, with the descriptive statistical method, the behaviors and purchasing demand of these websites users
9、 are analyzed to explore the characteristics and disparity of the factors including peoples choice among these group-buying websites, the products and services provided by them, the network application and the advertisement forms which would influence on the strategy, so that the market prospect can
10、 be forecast. Finally, adopting satisfaction analysis and crosstabs, the abuses and problems of online group-buying are found. Thus we will understand the characteristics of the network users group-buying behaviors, and give advice to the online group-buying websites and service providers, helping t
11、hem to make correct strategies.In doing what is said above, we will understand the characteristics of the network users IIIgroup-buying behaviors, and give advice to the online group-buying websites and service providers, helping them to make correct strategies.Key words: Internet;Group-Buying;Facto
12、r Analysis;Cluster Analysis;Satisfaction Level; CrosstabI目 次摘 要 .IAbstract .II1 绪论 .11.1 网络团购概述 .11.1.1 网络团购的含义 .11.1.2 网络团购的发展历程与现状 .11.2 研究目的与意义 .22 研究方法的基本思想及原理 .32.1 因子分析 .32.1.1 因子分析模型介绍 .32.1.2 因子分析的步骤 .32.2 聚类分析 .42.3 交叉列联表分析 .52.4 满意度分析 .52.4.1 满意度指数 .52.4.2 满意率 .63 实证分析 .73.1 问卷调查设计与分析 .73.
13、2 对所有被访者的基本状况分析 .83.2.1 网络团购的主要消费人群 .83.2.2 非团购用户基本状况分析 .123.2.3 网络团购用户基本状况分析 .153.3 在线用户市场细分 .173.3.1 生活和购物态度的因子分析 .183.3.2 应用聚类分析分出市场规模 .243.4 对团购网站的选择分析 .263.4.1 不同细分市场对团购网站的选择 .263.4.2 不同性别对团购网站的选择分析 .293.5 对团购产品与服务的选择分析 .31II3.5.1 潜在消费者对团购产品与服务的选择分析 .313.5.2 现有消费者对团购产品与服务的选择分析 .323.5.3 现有消费者参加团
14、购的原因 .353.5.4 现有消费者希望团购网站增加的产品与服务 .363.6 团购信息在网络上发布的渠道选择分析 .363.6.1 潜在消费者经常使用的网络应用 .373.6.2 现有消费者关注团购网站的渠道 .383.7 团购信息广告形式的选择分析 .383.8 团购用户对团购网站的满意度分析 .413.8.1 针对总体 .423.8.2 热门团购网站的满意度分析 .433.9 团购网站需要改进的方面 .444 结论与建议 .45致谢 .47参考文献 .4811 绪论1.1 网络团购概述1.1.1 网络团购的含义网络团购,又称团体购物,就是通过互联网平台,由专业团购机构将具有相同购买意向
15、的零散消费者(认识或不认识的消费者)集合起来,加大与商家的谈判能力,以较低的折扣向厂商进行大批量购买的行为。也可由消费者在团购网站上发布产品团购信息,自行发起并组织团购 。12根据薄利多销的原理,商家可以给出低于零售价格的团购折扣和单独购买得不到的优质服务。团购作为一种新兴的电子商务模式,通过消费者自行组团、专业团购网站、商家组织团购等形式,提升用户与商家的议价能力,并极大程度地获得商品让利,引起消费者及业内厂商的关注。团购的特点是:“让每一个人都能找到更优惠的团购商品,让不相识的消费者共同享受物美价廉的服务 。 ”11.1.2 网络团购的发展历程与现状“团购”一词是互联网领域的老词,2000
16、 年后互联网兴起,但由于缺乏清晰的商业模式,团购市场一直没有被真正激活。直到 2008 年 11 月,美国的安德里梅森成立了 Groupon(是目前全球最大的团购网站) ,其成立 7 个月后开始大规模盈利,并让后来者趋之若鹜,使团购成为互联网上窜红最快的商业模式。随着互联网在中国的普及和中国电子商务的繁荣发展,加之这种新模式的技术门槛较低,国内的团购网站更是如雨后春笋般出现。2010 年,中国网络团购行业已形成了“千团大战”的局面,网络团购已经在国内网民中流行起来。团购成为 2010 年中国成长最快的网络应用之一 。3中国网络团购市场的发展,对于推动中国生活服务业的互联网化、电子商务化具有深远
17、意义。从商户需求角度来看,团购模式将推动针对庞大的区域化营销市场的发展;从消费者需求角度来看,团购模式则将占居民生活服务方面的庞大消费支出搬到互联网上。团购模式带动的本地生活服务的电子商务化市场蕴含巨大商机 。4-6据中国互联网络信息中心(CNNIC)发布第 29 次中国互联网发展状况统计报告显示,2011 年中国网购用户规模达到 1.94 亿,与 2010 年相比,网购用户增长率为20.8%。其中,团购用户规模达到 6465 万。不过与发达国家相比,中国网络团购的渗2透率较低,网络团购的增长还远没有触顶,还有较大的渗透空间,未来网络团购用户和市场增长空间十分巨大 。7-91.2 研究目的与意
18、义在网络团购急剧膨胀的过程中,团购网站同质化竞争激烈,用户体验不佳、商家倍受诟病等问题层出不穷。团购网站如何脱颖而出?到底是什么因素影响着网络团购的健康持续发展?了解自身网站的薄弱之处,挖掘用户需求,了解其行为特征,进行市场细分显的越来越重要。本文在广东现代国际市场研究有限公司的数据支持下,对在线用户团购行为的网络调查数据进行分析。通过判断在线用户目前的团购状态等特征,划分为潜在消费者与现有消费者,通过研究其各自的基本特征,进行市场细分;研究其用户行为和购买需求:在选择团购网站、产品与服务、网络应用,以及能影响决策的广告形式等方面是否有何特点,是否存在差异;探讨网络团购中存在的弊端与问题,以及
19、其市场前景;从这一切分析中,了解团购的主要消费人群,给予团购网站与商家意见和建议,帮他们指明方向。截至 2011 年 12 月底,广东省网民数量达到 6300 万人,普及率为 60.4%,远远高于全国水平(38.3%) ,普及率排名居全国第三位,仅次于北京、上海。而在 2011 年 1-11 月中国网络购物市场省份订单量的排行榜中,广东省高居榜首,累计订单量突破 3亿单 。而网络团购作为中国成长最快的网络应用之一,其在广州的市场份额也不容8忽视,选取广东省作为研究也有其代表性;同时,团购大多都有地域上的特点;加之,在现有关于团购的分析研究中,还未看到有针对广东省这一大市场的独立研究。因此,本文
20、运用因子分析、聚类分析、满意度分析、交叉列联表分析等统计方法就广东省的在线用户调查进行统计分析。32 研究方法的基本思想及原理2.1 因子分析2.1.1 因子分析模型介绍因子分析方法最早是由德国心理学家查尔斯斯皮尔曼(Charles Spearman)提出的,是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,在尽可能不损失信息或者少损失信息的情况下,把一些具有错综复杂关系的变量归结为少数几个综合因子,用少数的因子代替原始变量,从而达到对原始变量的分类,揭露原始变量之间的内在联系的一种多变量统计分析方法。其数学模型可表示为:(2-1112112 2212mpppmpXaFaF )其矩阵
21、形式为: ,XAF其中 为可观测的指标向量(已标准化), 为不可观测的因子变量, 为因子FA载荷矩阵。 , 称为因子载荷, 的绝对值越大( ) ,表明 与 的()ijpmaij ija1ijaiXjF相依程度越大,或称公共因子 对于 的载荷量越大; 为特殊因子,用来说明原有jFiXi变量不能被公共因子解释的部分。且该模型满足:(1) 即 与 不相关。(,)0,CovF(2) 。即向量 的协方;()(,)1,2,ij iiijVarCovFijm。 F差阵为 阶单位阵。m(3) 即向量 的协方差阵为 阶对2(,),;(),ij iivijjp。 。 p角阵。2.1.2 因子分析的步骤1) 检验待
22、分析的原始变量是否适合于因子分析因子分析要求原变量之间必须具有相关性,否则变量间就没有共享的信息,就无法综合出能反映共同特征的少数公共因子。因此,在因子分析前需要对原始变量作相关性分析。其中一种方法就是计算变量之间的相关系数矩阵,若大部分相关系数都小4于 0.3,且未通过统计检验,那么这些变量就不适合进行因子分析。本文采用比较常用的 KMO 统计量和 Bartletts 球度检验加以判定。KMO 统计量用于探查变量间的偏相关性,取值范围在 0-1 之间,一般认为当 KMO 大于 0.9 时效果最佳,0.7 以上是效果尚可,0.6 时效果很差,0.5 以下时不适宜做因子分析。Bartletts
23、球形检验是用于检验相关阵是否为单位阵,即各变量是否各自独立。如果结论为拒绝该假设,则说明这些变量可能各自独立提供一些信息,适合做因子分析;相反,则不适合做因子分析。2) 求解公共因子及因子载荷矩阵本文运用 SPSS 采取主成分法进行初始公共因子的提取。用主成分法寻找公共因子的方法通过旋转坐标的方式得到 个互不相关的主成分,其中将 个主成分按由大到pp小的顺序排列,记为 ,一般在较少信息量损失的前提下,只保留前 个主PY,21 m成分而把后面的部分用 代替,且要求此处的主成分的方差为 1,因此将其标准化,得i到公式(2-1) 。这样,就得到了载荷矩阵 和一组初始公因子(未旋转) 。有时我们得A到
24、的初始因子解各主因子的典型代表变量不是很突出,容易使因子的意义含糊不清,不便于进行实际问题的分析。这时可以进行因子旋转,以期找到意义更明确、实际意义更明显的公共因子。本文采用方差最大化的正交旋转(Varimax),使载荷矩阵的每一列元素的绝对值向 1 和 0 两极分化。3) 求解因子得分当因子模型建立起来之后,反过来用回归的思想求出以公共因子为因变量、原始变量为自变量的回归方程:(2-2)mjXXFpjjjj ,21,21 把样本变量带入上面的关系式就会得到各样本的因子得分值。2.2 聚类分析聚类分析起源于分类学,其基本思想是:从一批样品的多个观测指标中,找出度量样本之间或指标之间相似程度,即亲疏关系的统计量,构成一个对称的相似性矩阵,在此基础上进一步找寻各样品或变量之间或样品组合之间的相似程度,按相似程度的大小,把样品或变量逐一归类,关系密切的归类聚集到一个小的分类单位,关系疏远的聚集到一个大的分类单位,直到所有样本或变量都聚集完毕。聚类分析内容非常丰富,有系统聚类法、模糊聚类法、K-Mean 聚类法、有序样品聚类法、分解法、加入法等。本文因为样本量比较多,因此采用 K-Mean 聚类,其核心步骤是:1) 指定聚类数目 。K