1、挖掘在电子商务中的应用研究摘 要 当今电子商务蓬勃发展,其网站服务器上积累了大量的数据,这些数据隐含着很多对市场分析及预测有用的知识,可以运用 web挖掘技术加以获得,从而增强企业的竞争力。本文主要介绍了 Web 挖掘的概念和分类,论述了电子商务中 Web 挖掘的过程和方法,最后阐述了Web 挖掘技术在电子商务中的应用。 关键词 电子商务 数据挖掘 Web 挖掘 电子商务采用数字化方式进行商业活动,是在电子网络环境中进行商品和服务的贸易活动。近年来,随着网络的普及和 Internet 的发展,各企业均积累了大量的数据。如何从这些数据中发现潜在的规律,来帮助制定企业今后的发展战略,是各电子商务平
2、台急待解决的问题。Web 挖掘作为数据挖掘的一个重要分支,为上述问题提供了有效的解决途径。 一、web 挖掘 数据挖掘就是从大量的、不完全的、有噪声的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的知识的过程。它融合了数据库、人工智能、机器学习等多个领域的理论和技术。Web 挖掘是数据挖掘在 web 上的应用,是指从与 web 相关的资源和行为中抽取感兴趣的、有用的模式和隐含知识。一般地,Web 挖掘可分为三类: 1.Web 内容挖掘,是从文档内容或其描述中抽取知识的过程。它又可以分为 Web 页面内容挖掘和搜索结果挖掘。页面内容挖掘指的就是对Web 页面上的数据进行挖掘, 而搜索
3、结果挖掘则指的是以某一搜索引擎为基础,对已搜索结果进行挖掘。 2.Web 结构挖掘,是从 www 的组织结构和链接关系中推导知识。它又可以分为外部结构挖掘、内部结构挖掘和 URL 挖掘。Web 结构挖掘的目的是通过聚类和分析网页的链接, 发现网页的结构和有用的模式, 找出权威页面。 3.Web 使用挖掘,即 Web 日志挖掘,是通过挖掘 Web 日志记录,发现用户访问 Web 页面的模式。它又可分为一般访问模式挖掘和个性化服务模式挖掘。 二、Web 挖掘的过程 1.数据收集。Web 挖掘的数据对象包括服务器日志数据、代理服务器数据、web 页面内容、web 超链接信息、用户注册信息等,其中服务
4、器日志数据是 web 挖掘的主要对象。 2.数据预处理。数据预处理是 web 挖掘的重要步骤,直接影响到最后挖掘结果的正确性和准确性。它通常包括以下几个方面: (1)数据清洗,是指根据需要删除与 web 挖掘任务无关的数据,过滤掉不需要的记录。(2)反蜘蛛化。现在互联网上有大量的蜘蛛程序,它们模拟用户在各网页间爬来爬去。但它们并不代表真实的电子商务用户,因此需要把服务器日志中的蜘蛛记录过滤掉,以更真实地反映实际情况。(3)客户认证,是从服务器日志中识别出访问网站的每个用户。(4)会话识别。会话是指客户在一次访问中所访问的所有 web 页面,通过分析可以得到,用户对电子商务站点的兴趣所在。(5)
5、路径补全。由于客户端缓存的存在,会造成一些重要的访问信息被遗漏,所以需要对用户访问的前后页面进行推理,补全访问路径。 3.模式发现,是运用各种方法,发现隐藏的模式和规则。常用的方法有:关联分析,分类分析,聚类分析,序列分析。 4.模式分析。模式分析是找出所发现模式集合中的有用模式,以便对决策提供支持。如果所有模式均不令人满意,则需要重新挖掘。 三、Web 挖掘的方法 1.关联分析,用于发现同一事件中不同数据项的相关性。常用的Apriori 算法分为两步,首先找出满足最小支持度阈值的频繁项集;然后由它们形成满足最小置信度阈值的强关联规则。可以将 web 挖掘得到的关联规则用于改进电子商务站点的结
6、构,将相关联的商品放在一起,减轻用户过滤信息的负担,增加交叉销售。 2.分类分析,通过学习已被告知类标号的训练集,得到分类器模型,然后将其用于对其它数据的分类。常用的方法有贝叶斯分类法、决策树技术和支持向量机技术。 3.聚类分析,使用划分方法、层次方法、基于密度的方法、基于网格的方法等技术,使同一类中的对象之间具有很高的相似度,而不同类中的对象高度相异。经聚类分析,可以对电子商务平台中的具有相似浏览模式的用户提供个性服务,以满足该类消费群体的特殊需要。 4.序列分析,是挖掘频繁出现的有序事件或子序列模式,侧重于数据项间的前后关系。在电子商务平台上,可以帮助企业预测用户未来的购买行为,指导企业制
7、定销售计划。 四、Web 挖掘在电子商务中的应用 1.提供个性化服务。通过分析用户的访问模式,对用户进行聚类和分类,为每一类用户提供迎合其兴趣的个性化服务,提高电子商务平台的人性化设计,从而提高用户的满意度,留住老用户;对具有潜在消费能力的用户,通过提供个性化服务,可以刺激他们的消费,提高电子商务平台的亲和力。 2.优化 web 站点结构。通过分析用户的浏览路径,用有向图来表示用户的整个页面访问过程,图中的顶点代表页面,图中的边代表页面的访问顺序。通过 web 挖掘找出频繁访问路径,得到电子商务平台上的主要页面,将重要的销售信息放在上面,有利于用户快速找到自己需要的商品。 3.降低电子商务平台
8、运营成本。通过挖掘用户的行为记录和反馈情况,预测未来的购买行为,进行有针对性的市场营销活动;通过分析用户感兴趣的页面,有针对性地投放广告。 五、结束语 随着信息技术的飞速发展,电子商务在商业贸易中的份额越来越大,使用 web 挖掘技术对企业积累的海量数据进行处理,挖掘出合适的模式,帮助企业在激烈的市场竞争中做出正确的决策,对提高企业的市场竞争力有重要意义。随着 web 挖掘技术的不断发展和成熟,一定会在电子商务应用领域有广阔的应用前景。 参考文献: 1Jiawei Han,Micheline Kamber 著,范 明,孟小峰 译:数据挖掘概念与技术M.机械工业出版社,2001,8 2朱志国 孔立平:Web 使用挖掘技术在电子商务的研究与应用.长沙通信职业技术学院学报,2007,7(1):3237