文献综述:互联网旅游信息采集与分析系统的开发.pdf

上传人:文初 文档编号:1099008 上传时间:2018-12-06 格式:PDF 页数:8 大小:213.08KB
下载 相关 举报
文献综述:互联网旅游信息采集与分析系统的开发.pdf_第1页
第1页 / 共8页
文献综述:互联网旅游信息采集与分析系统的开发.pdf_第2页
第2页 / 共8页
文献综述:互联网旅游信息采集与分析系统的开发.pdf_第3页
第3页 / 共8页
文献综述:互联网旅游信息采集与分析系统的开发.pdf_第4页
第4页 / 共8页
文献综述:互联网旅游信息采集与分析系统的开发.pdf_第5页
第5页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、北京化工大学本科毕业设计(论文)文献综述学号:北 京 化 工 大 学毕业设计(论文)文献综述论文题目:互联网旅游信息采集与分析系统的开发以百度旅游为例学院名称:经济管理学院专业:信息管理与信息系统学生姓名:导师姓名:开题日期:指导教师意见指导教师签字北京化工大学本科毕业设计(论文)文献综述前言2 0 1 5年被国家旅游局确定为“美丽中国-丝绸之路旅游年”,中国旅游业蓬勃发展,在如今经济下行压力加大之时,旅游消费依然成为新的经济增长点,旅游经济运行综合指数回升至近三年来的高位水平。国民旅游市场需求旺盛,国家旅游局数据显示,2 0 1 5上半年国内旅游人数为2 0 .2 4亿人次,同比增长9 .9

2、 %,旅游收入更是实现两位数增长,高达1 2 .4 %。国内游市场发展强劲,旅游消费总额创历史新高,伴随着中国旅游业的高速发展,行业规模不断扩大,导致旅游数据信息爆炸性的增长,旅游数据已经形成一个巨大的海量信息空间。利用海量的旅游原始数据,快速、准确、方便地对日常积累的反映旅客信息的海量旅行数据进行旅游挖掘分析,已经成为旅游大数据应用新方向。在旅游领域,随着信息技术发展,潜在旅游者利用互联网查询目的地信息、选择旅游线路、制定具体的旅游规划,这种现象越来越普及。以携程旅行网、乐途旅游网、同程网、芒果网为代表的在线旅游网站,除了提供旅游产品信息外,更提供了大量的旅游评论数据,在线旅游评论数据基于众

3、多网友的亲身体验为旅游者了解旅游产品提供了有效的信息,强烈地影响着旅游者决策的制定。由于大部分潜在旅游者旅游时间非常有限,而耗费大量时间成本筛选目的地,并且目的地真实情况难以保证,这种情况严重影响到旅游者出行计划和满意度,加大了旅游者出行成本。基于以上,互联网旅游信息采集与分析系统依靠分析不断更新的海量在线用户评论数据,建立旅游目的地评价体系,匹配旅游者的个人需求,实现目的地的个性化推荐,并提供相关旅游目的地信息分析的功能。在此过程中,我通过知网平台、万方数据平台及Elsevier、IEEE英文平台下载了大量与本研究问题相关的文献进行学习。阅读了篇文献国内外文献,文献形式包括期刊论文也包括网络

4、新闻等信息,尽可能对该领域的知识及理论研究有充分的了解和学习。本文通过对推荐系统和算法的论述总结,提出互联网旅游信息采集与分析系统的理论支撑。1、推荐系统概念互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率北京化工大学本科毕业设计(论文)文献综述反而降低了,这就是所谓的信息超载(informationoverload)问题。1 9 9 5年3月,卡耐基.梅隆大学的RobertArmstrong等人在美国人工智能协会上提出了个性化导航系统W

5、eb Watcher;斯坦福大学的MarkoBalabanovic等人在同一会议上推出了个性化推荐系统LIRA;推荐系统能够有效的解决信息超载问题,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐系统。和搜索引擎相比推荐系统通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。一个好的推荐系统不仅能为用户提供个性化的服务,还能和用户之间建立密切关系,让用户对推荐产生依赖。目前流行的推荐算法主要分为四大类:基于内容的推荐算法、协同过滤推荐算法、基于知识的推荐算法和混合的推荐算法。1 .2国内外研究现状从2 0世纪9 0

6、年代中期推荐系统的概念出现至今,推荐系统得到了飞速发展。电子商务、网上交易的蓬勃兴起,给推荐系统提供了良好的契机和发展平台。由于巨大的应用需求,推荐系统得到了广泛的关注,国内外许多学者研究推荐系统,美国计算机协会(ACM)多次把推荐系统作为研讨主题1 ,众多国内外期刊也纷纷将推荐系统作为研究专题2 。在我国,学术界也开始逐渐重视推荐系统的研究。国家自然科学基金曾资助过“面向电子商务的顾客偏好分析与个性化分析系统”、“电子商务个性推荐系统及应用研究”等项目,而且电子商务网站中推荐系统的应用水平也有了不同程度的提高。2 .推荐算法2 .1基于内容的推荐算法基于内容的推荐( content- bas

7、ed recommenda-tion)也称为基于内容的信息过滤推荐,它不需要用户对推荐对象进行评价,而是把推荐对象的内容特征抽取出来,然后从用户以往选择对象的内容特征去学习用户的偏好兴趣,最后与用户偏好兴趣匹配度较高的对象将被推荐给用户。基于内容过滤的推荐是建立在项目自身属性信息基础上的一种推荐算法,其主要依赖的是项目自身的属性息,而不去考虑用户反馈的项目评价和偏好。基于内容过滤的推荐有着很多优点,如无项目的冷启动问题和矩阵稀疏的问北京化工大学本科毕业设计(论文)文献综述题,对于偏好小众的用户依然可以进行推荐,在推荐时容易例举出推荐的理由等,但是会出现难以区分商品信息的品质和风格,不能为用户推

8、荐新出现的感兴趣的商品,自我学习能力较差的问题。描述基于内容的推荐方法主要有两种类型:启发式的方法和基于模型的方法。启发式的方法就是用户凭借经验来定义相关的计算公式,然后再根据公式的计算结果和实际的结果进行验证,然后再不断修改公式以达到最终目的。而对于模型的方法就是根据以往的数据作为数据集,然后根据这个数据集来学习出一个模型。一般的推荐系统中运用到的启发式的方法就是使用tf-idf的方法来计算,跟还有tf-idf的方法计算出这个文档中出现权重比较高的关键字作为描述用户特征,并使用这些关键字作为描述用户特征的向量;然后再根据被推荐项中的权重高的关键字来作为推荐项的属性特征,然后再将这个两个向量最

9、相近的(与用户特征的向量计算得分最高)的项推荐给用户。在计算用户特征向量和被推荐项的特征向量的相似性时,一般使用的是cosine方法,计算两个向量之间夹角的cosine值。Mooney等在Book recommending using test categorization with extractedinformation(1 9 9 8)3 中将贝叶斯分类算法引入到内容推荐中。Mostafa和Lam在Automatic classification using supervised learning in a medical document filteringapplication(2

10、0 0 0)4 中运用神经网络研究内容算法;Zenebe和Norcio在similaritymeasures and aggregation methods using fuzzy sets for content5 中将模糊数学方法应用于基于内容的产品推荐(2 0 0 9),Cui CS,Wu Q Z在Research on electriccommerce recommender systems based on vargue set(2 0 0 9)中6 将Vague集方法应用于内容推荐算法的产品表示中,以上研究,均立足于产品的特征,通过消除产品特征的不确定性,以获得产品相似性的描述,由

11、此可见,在基于内容的推荐系统中,产品相似性的描述与计算机表示是决定内容推荐算法质量的一个重要因素。郭桑(2 0 1 2)7 ,利用内容分析法对2 0个IT企业网站版式布局进行分析,归纳出实用效果较好的企业网站布局架构及其特征。卢小丽等(2 0 0 6)8 ,运用内容分析的方法对中外旅游文献中有影响力的4 0个生态旅游概念进行分析,总结出最能代表生态旅游概念内涵的6个标准。刘毅(2 0 0 6)9 ,通过建立内容分析法的分析框架对网络舆论信息进行分析,并对信息传播效果和变化趋势进行预测。彭钰(2 0 1 1)1 0 ,利用内容分析法对中国戏曲网站向用户传播的内容进北京化工大学本科毕业设计(论文)

12、文献综述行类型分析。张慧(2 0 1 2)1 1 ,利用内容分析法对泉州、厦门地区的3 0家高星级饭店服务质量进行了实证比较分析,并提出可行性建议。冯明等(2 0 1 2)1 2 ,对内容分析法定义和分类进行总结,并阐述了该方法在企业管理实践中的应用现状。初步探讨了该方法的应用前景和在未来应用研究中应采取的措施。范向丽等(2 0 1 0)1 3 ,将内容分析法引入到旅游安全研究领域,以2 0 0 1 -2 0 0 7年中国女性游客安全事故报道为研究对象,对其趋势、特征、规律等进行了分析。崔春生等(2 0 1 5)1 4 通过可拓学中基元的表示方法,实现了推荐系统中定性描述和定量评的有机结合;运

13、用距离的思想探讨了待推荐产品与理想产品之间的相似性,进而获得了各个产品的推荐度相对于已有的内容推荐算法,该方法不仅解决了推荐领域中产品特征难以表示的问题,同时也解决了推荐过程的不确定干扰。通过以上研究文献地论述,可以看出内容分析法应用研究领域十分广泛,涉及到网站布局研究、旅游领域概念定义和事件研究、网络信息传播分析、酒店类质量研究、企业管理实践应用研究等方面。这是内容分析法作为一种社会科学研究方法的普适性决定的。国外内容分析法应用比较早,研究的学科领域涉及到图书情报学、社会学、新闻传播学、计算机科学、医学五类。各类学科背景的研究者研究的角度均具有不同的侧重点,推动了内容分析法在理论和实践应用方

14、面的发展完善。图书情报学领域关注对图书推荐的研究,为读者提供便捷的读书服务功能,降低图书搜索的困难。社会学研究主题比较多样,涉及到对众多的社会现实问题的研究和解决。新闻传播学是最常用到内容分析法的学科,研究内容涉及到新闻传播的流程和媒介的各方面,研究的成果更强调时效性。计算机科学注重计算机技术在内容分析法中的应用研究,目标是推动内容分析法在技术领域的发展完善。医学侧重利用内容分析法研究医学数据,解决数据处理过程中的实际问题。国内研究方面,2 0世纪9 0年代学术界开始引入内容分析法,图书情报学、新闻传播学、医学是主要的研究学科1 5 。随着信息技术提升和内容分析法地深入发展完善,其应用领域将不

15、断拓展,将在各个应用领域起到重要价值。2 .2协同过滤推荐算法协同过滤推荐(collaborative filtering recommen-dation)是推荐系统中最为流行且应用广泛的算法,它基于系统里其他用户的评分记录或其他历史数据。Breese J S, Heckerman D等在Empirical Analysis of Predictive Algorithms forCollaborative Filtering中将协同过滤方法分为基于记忆( memory-based)和基于模型( model-based)的方法,前者利用历史数据来寻找相似的推荐项目,后者通北京化工大学本科毕业设

16、计(论文)文献综述过历史数据构造预测模型,再通过模型进行评分预测,它们的不同在于对用户-项目评分矩阵的分析和使用方式上的差异。从目前的研究成果分析,协同过滤算法主要存在数据稀疏性、冷启动、扩展性等方面问题。随着用户和项目数的不断增加,协同过滤算法的复杂度剧增,传统协同过滤法呈现出缺乏可扩展性的问题。因此,协同过滤法的算法研究也主要集中于对传统算法的改进应用方面。目前国内对可扩展性改善技术的研究成果较多,各位学者研究的视角也存在较大差异,综合涉及从用户兴趣、用户行为模式、用户反馈系统、聚类技术等方面加强对协同过滤法的改善,在一定程度上解决了可扩展性问题,具有宝贵的借鉴价值。用户兴趣方面:秦光洁等

17、(2 0 0 9)1 6 ,提出综合兴趣度的概念,解决传统协同过滤方法难以准确确定目标用户最近邻的问题;刘旭东等(2 0 1 0 )1 7 ,提出基于群体兴趣偏好度的改进算法,对用户未评分项目进行有效预测;赵晓煜等(2 0 0 9)1 8 ,提出商品的最近购买时间、购买频率和购买金额三个指标,建立基于顾客交易数据的改进方法。通过对用户兴趣度的分析,能获悉较为稳定的用户特征,有利于对用户兴趣趋向进行预测和把握,预测填补未评分项目,缓解数据稀疏性问题。用户行为模式方面:尹柱平等(2 0 1 1)1 9 ,提出以用户行为特征对应一定分值的模式,代替空缺评分方式;沈磊等(2 0 0 9)2 0 ,通过

18、分析用户浏览信息,预测用户对项目的评分,建立用户浏览购买模型。通过对用户行为模式的判定,将用户的行为习惯作为研究和利用对象。在用户行为习惯的基础上,对未评分项目进行评分,也更能准确地反映用户的行为特征。用户反馈系统方面:傅鹤岗等(2 0 1 1)2 1 ,提出基于用户实时反馈的协同过滤算法,通过对推荐模型数据实时更新,及时反映用户兴趣的变化。将用户对信息的反馈,作为研究对象,及时把握用户的兴趣变化和个性需求,针对性地帮助用户解决问题,满足要求,过滤不必要和滞后信息,提升推荐的准确性。以上的研究成果均在一定程度上缓解了协同过滤法可扩展性问题,而目前国内针对可扩展性改善技术的研究焦点主要集中于对聚

19、类技术地探讨,依据数据划分聚类,只对聚类内部元素进行评分预测和形成推荐,大大缩短了数据搜索、评分、推荐的数据量,通过此种方法能有效地提高协同过滤法的扩展性。2 .3基于知识的推荐算法很多推荐算法都无法解决冷启动问题,因此不少专家提出基于知识的推荐北京化工大学本科毕业设计(论文)文献综述(knowledge- based recommendation),希望利用用户的需求爱好、产品知识和功能知识来为用户推荐项目,该方法在某种程度可以看成是一种推理(infer-ence)技术2 .4推荐算法和混合的推荐算法混合推荐是为解决协同过滤、基于内容和基于图结构推荐算法各自问题而提出的,达到“相互取长补短”

20、的推荐效果.例如,基于内容方法可以解决协同过滤中“新项目”问题,而协同过滤可降低基于内容算法面临的“过拟合”问题。常用的混合推荐有:(1 )将协同推荐和基于内容推荐单独运行的结果进行组合推荐;(2 )将基于内容推荐的特征融合到某种协同推荐中;(3 )建立具有基于内容推荐和协同推荐特点的预测模型3结论经过2 0多年的发展,推荐技术取得了长足进步,然而现有的推荐算法仍面临诸多困难与挑战,其中数据稀疏、过拟合、可扩展性和多媒体信息特征提取是主要问题。现有的技术和方法都不能从根本上解决这些问题。本文将采用内容推荐算法,在对一些特征比较明显的项目上使用内容过滤算法来获得对用户的推荐结果效果比较显著且适合

21、文本处理。参考文献1 Riedl J,Dourish P. Introduction to the Special Section on Recommender Systems.J. ACM Transactions onComputer-Human Interaction, 2 0 0 5,1 2 :3 7 1 -3 7 3 .2 Ricci F, Werthner H. Introduction to the special issue :Recommender systems.J.International Journal of Electronic Commerce,2 0 0 6,1

22、 (2 ):5 -93 Mooney R J,Bennett P N,Roy L.Book recommending using test categorization withextracted information.Proceeding of the AAAI9 8 /ICML9 8 WOrkshop on Learning forText Categorization .Madison:AAAI Press,1 9 9 8 ,4 9 -5 44 Mostafa J,Lam W.Automatic classification using supervised learning in a

23、 medicaldocument filtering application.Information Processing andManagement,2 0 0 0 ,2 7 (6 ):2 1 0 8 -2 1 1 05 Zenebe A,Norcio A F.similarity measures and aggregation methods using fuzzy setsfor content-Based recommender systems.Fuzzy Sets and Systems,2 0 0 9 ,(1 6 0 ):7 6 -9 46 Cui C S,Wu Q Z.Rese

24、arch on electric commerce recommender systems based onvague set.First IEEE International Conference on Information Science andEngieering.Nanjing:IEEE,2 0 0 9 ,5 3 8 2 -5 3 8 5 .7 郭桑.基于内容分析法的企业门户主页架构研究:以IT企业为例.图书馆学研北京化工大学本科毕业设计(论文)文献综述究,2 0 1 2 (1 ):1 5 -1 88 卢小丽.基于内容分析法的生态旅游内涵辨析.生态学报,2 0 0 6,2 6 (4

25、):1 2 1 3 -1 2 2 09 刘毅.基于内容分析法的网络舆论信息研究.天津大学学报(社会科学版),2 0 0 6,8 (4 ):3 0 7 -3 1 01 0 彭钰.基于内容分析法的中国戏曲网站研究.东南传播,2 0 1 1 (5 ):4 0 -4 21 1 张慧.基于内容分析法的高星级饭店服务质量实证比较研究.华中农业大学学报(社会科学版),2 0 1 2 (2 ):7 7 -8 41 2 冯明等.内容分析法在企业管理研究中的应用评述.科学决策,2 0 1 2 (2 ):8 3 -9 41 3 范向丽等.内容分析法在旅游安全研究中的应用.北京第二外国语学院学报,2 0 1 0 (3

26、 ):3 7 -4 41 4 崔春生,赖锴,陈婕.基于基元理论的内容推荐算法研究J.系统科学与数学,2 0 1 5 ,1 0 :1 2 0 9 -1 2 1 8 .1 5 邹菲.内容分析法的理论与实践研究.评价与管理,2 0 0 6,4 (4 ):7 1 -7 71 6 秦光洁.基于综合兴趣度的协同过滤推荐算法.计算机工程,2 0 0 9,3 5 (1 7 ):8 1 -8 31 7 刘旭东.一种改进的协同过滤推荐算法.武汉理工大学学报(信息与管理工程版),2 0 1 0,3 2 (4 ):5 5 0 -5 5 31 8 黄光球.基于兴趣度的协同过滤商品推荐系统模型.微电子学与计算机,2 0 0 5,2 2 (3 ):5 -81 9 赵晓煜.基于顾客交易数据的协同过滤推荐方法.东北大学学报(自然科学版),2 0 0 9,3 0 (1 2 ):1 7 9 2 -1 7 9 52 0 尹柱平.基于用户行为与角色的协同过滤推荐算法.桂林电子科技大学学报,2 0 1 1,3 1 (3 ):2 3 0 -2 3 32 3 傅鹤岗.基于用户实时反馈的协同过滤算法.计算机应用,2 0 1 1,3 1 (7 ):1 7 4 4 -1 7 4 7

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 文献综述

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。