1、本科毕业论文(20 届)获取广告行业数据的途径及方法研究所在学院 专业班级 广告学 学生姓名 学号 指导教师 职称 完成日期 年 月 摘 要“大数据”时代的到来,意味着数据信息的迅速膨胀,数据充斥着互联网世界,但是正是由于信息的碎片化和海量化,导致广告学的老师、学生、广告从业者难以通过传统的搜索引擎的方式从互联网中即时地获取有效的数据信息。但是,同时也要感谢“大数据”时代的到来,带来了一批依托大数据而诞生的新型数据分享平台,为广告人提供了大量即时更新的准确数据。本文从“数据获取工具”以及通过集合多方位的信息去归纳出有效数据两个方向去探讨在“大数据”时代下获取广告行业数据的途径及方法。关键词:大
2、数据 数据分享平台 广告调查ABSTRACTThe arrival of “big data“ era, means that the data information of rapid expansion, and data is flooded with the Internet world, but precisely because of fragmented and quantitative information, leading advertising teachers, students, advertising practitioners difficult through
3、traditional way of search engines to acquire effective information from the Internet instantaneously. But also thank the arrival of “big data“ era , which has brought a number of relying on big data and the birth of the new data sharing platform , and provides advertisers with a large number of real
4、-time updates of accurate data. This article from two directions , data acquisition tool and through all-round information collection to induce effective data , to discuss in the era of “big data“ access to the advertising industry data .Keywords : Big data Data sharing platform Advertising research
5、目 录1 引言12 广告行业数据12.1 广告行业数据的重要性12.2 传统获取广告行业数据的方法22.3 “大数据”时代下的广告行业数据33 数据分享平台分析53.1 百度指数53.1.1 基本介绍53.1.2 平台构成53.1.3 平台适用人群93.1.4 平台的局限性93.2 淘宝指数93.2.1 基本介绍93.2.2 平台构成103.2.3 平台适用人群113.2.4 平台的局限性113.3 数据魔方123.2.1 基本介绍123.2.2 平台构成123.2.3 平台适用人群153.2.4 平台的局限性164 集合多方位信息获取数据164.1 整合文本归纳数据164.2 无处不在的数据
6、165 结束语17参考文献 19致谢 2011 引言 本课题研究的主要内容是获取广告行业数据的途径及方法研究,广告行业数据就是泛指在广告策划或撰写与广告相关的报告的过程中所需要的数据,属于广告调查的范畴。无论是广告专业的老师、学生亦或是从事广告行业的工作者都经常会为难以寻找所需要的广告数据所困扰。奥格威先生在他的一个广告人的自白一书中曾经说过“客观使用市场调研并认真分析数据,是做好策划案的基本前提。 ”一份方案或者一个结论的推导要想具有强有力的说服力,必须要依托一系列的数据去支撑,去验证,而不能只是单纯地依靠主观臆想或经验推断。可见数据的获取及使用对广告行业的重要性。在如今这个“大数据”的时代
7、,数据虽然充斥着我们的生活,但是当我们想获得针对性的数据时,面对杂乱的数据海洋,我们难以获得精准的,实时的数据。一些广告从业者也许只能依靠购买专业的数据监测公司(如艾瑞,易观监测)发布的相关报告来获取数据或者花费大量的时间和金钱去做实地的市场调研,对于一些经济能力有限的学生或者其它的广告工作者,要想集中,快速地获得实时数据,简直就像是天方夜谭。但是,感谢”大数据“时代的到来,为广告人获得实时数据提供了多种便捷的工具和途径。目前比较常用的数据分享平台主要有百度指数,淘宝指数,数据魔方,量子恒道等等。本文将会介绍每一个数据平台的基本情况,通过对各个数据平台进行深度分析,得出每一个平台的数据特点,数
8、据的适用范围以及所获得的数据的局限性等等。除了依靠数据分享平台外,广告人还能通过多方位的信息(包括单纯的文字信息和数据信息)去获取你想要的数据。本文将会介绍并分析一些获取数据的方法。例如通过归纳文字信息去获取所需要的数据,结合多份报表去提取数据。2 广告行业数据2.1 广告行业数据的重要性最近电视上经常能看到雪碧的一则新的电视广告,目前在各大视频网站上搜索“雪碧,辣放马过来”就能看到。这一则广告主演是周杰伦,一开始就在旁边说“没有雪碧,能痛快吃辣吗?”画面中像是几个人在比赛谁更能吃辣,当辣到受不了的时候,其中一个人拿起满满的一杯冰凉的雪碧,狠狠喝上一大口,顿时一股冰凉解除了辣的感觉,之后周杰伦
9、出来说“很明显,有冰爽柠檬味的雪碧,辣,放火过来!”当初一看这个广告的时候,我有点不解,雪碧怎么出了这么一个广告,周杰伦就在旁边一直说着话告诉你辣就要喝雪碧,整个广告感觉没什么创意点。但是后来,我渐渐发现我自己在每一次吃了辣的东西后,我都会很容易联想到雪碧,也想痛痛快快地来一大口。一则好的广告,可以和目标消费者产生共鸣,能直指人心,把目标消费者内2心渴望但没有说出来的需求清晰地表达出来。这就需要这则广告拥有一个深刻的消费者洞察。雪碧这则广告就很好地做到了这一点,发现消费者在吃辣时,虽然痛快,但也会想迅速解辣以便之后继续痛快吃辣。而消费者洞察除了需要各种头脑风暴的工具外,还需要一大批的数据作为支
10、撑,例如目标消费者的年龄,性别,购买行为,生活习惯等等。数据是获得一个准确的消费者洞察的基础。除了消费者洞察外,一则好的广告还需要通过市场调查来了解自身的差异性和其它竞品的发展情况,从而能根据现实中市场的情况去制定最适合品牌的传播策略和创意策略。一直以来,在餐桌上,人们往往会认为都是碳酸饮料的可乐和雪碧所担当的角色是一样的,所以人们一般只会选择两者中的其中一种在餐桌上喝,而可乐作为一个深得人心的老牌子,往往会成为人们宴会的首选。根据 2010年中国碳酸饮料市场报告显示,雪碧的销量占可口可乐的 75%,而雪碧销量比较大的场所主要是在一些夜店搭配红酒饮用,所以在平常的餐桌上,雪碧与可乐相比,销量要
11、低得多。一直以来,雪碧都没有找到一个适合自己的定位来突出自身的差异性。而这次的这一则雪碧“放火过来”的广告则很好地体现了雪碧的新的定位“喝雪碧,痛快吃辣。 ”自然而然人们在餐桌上吃辣就会不禁地想起雪碧。而这个创意策略肯定离不了在广告策划的初始阶段,广告人员通过开展一系列的市场调查来了解目前碳酸饮料市场的情况,调查可能会包括,各个竞品的差异性以及市场占有率,各类餐饮业中消费者饮用饮料的习惯以及消费心理等等。只有通过一系列详细的数据才能找出雪碧区别于其它碳酸饮料的定位,从而发展出适合品牌的传播策略和创意策略。19 世纪末,美国百货零售业之父约翰华纳梅克曾经说过一句广告人都很熟悉的话, “我知道我的
12、广告费浪费了一半,问题是我不知道哪一半被浪费了” 。今天,我们常常会发现,在浏览网页的时候,推送的广告很多都会是我们当时所需要购买的东西,这些广告就像是为我们个人订制的感觉。确实,在互联网上,用户的路径数据很容易就被截取,平台可以运用这些截取的数据推送给消费者他们所想要看到的广告,广告的投放越来越精准,大大减少了广告费用的浪费。用户路径数据除了能帮助广告精准投放外,还能更好地指引网页规划以及网页设计。例如,淘宝的量子恒道有一个热力图,可以让广告主以及广告公司看到用户在设计上喜欢点击的地方是哪里,从食品类的网页看,消费者一般喜欢点击的是产品的食欲图,所以说一些没有食欲图的产品,可以加上食欲图来增
13、加网页的转化率。2.2 传统获取广告行业数据的方法按照数据产生的过程的不同,可以分为二手数据和原始数据,原始数据是需要通过实地调查,收集被访者的或者市场活动中的数据。经常用到的方法有小组访谈法、深度访谈法、观察法、调查法、实验法等等。这些方3法的优点是能有针对性地去获取方案或者项目所需要的数据,缺点则是要花费大量的时间,包括调查前的准备,调查过程中所要花费的时间,以及调查完毕后对数据进行整理。同时一些时间跨度大的数据很难通过实地调查或者与消费者访谈去获取。加上人力的花费,要想能获得客观准确的原始数据,还需要较高的成本。这对于一些学生以及一些小型的广告公司,通过各类调查获得准确的原始数据还是比较
14、困难的。与原始数据相比,二手数据的获取方式适用性更广。二手数据是指已经存在的数据,例如一些内部的数据库,行业的统计报告,公司的财报等等。二手数据的优点是便捷,随时随地就能通过翻阅资料和在互联网上得到,同时数据的时间跨度大,一些年代比较久远的数据也能拿到。如果是自己在已有的数据上去搜集,虽然会花费一定的时间,但是能大大降低获取数据的成本。当然,如果有一定的资金,还可以直接购买数据公司的数据,省时省力。但是二手数据也有一定的局限性:不一定能找到项目所需要的数据;来源于互联网的数据真假难辨;如今互联网数据繁杂,充斥着各类垃圾信息,获得想要的数据还需要花费一定的时间去寻找。2.3 “大数据”时代下的广
15、告行业数据麦肯锡是全球最著名的管理咨询公司之一,最早提出了“大数据”时代到来的观点,麦肯锡表示:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。 ”而对于广告行业来说也不例外。大数据时代下的广告行业数据也具有数量大,数据来源渠道多样,调查的样本范围广,数据处理分析的速度快等特点。在现今的互联网环境下,用户在互联网上的任意活动都会留下一系列的数据,同时伴随着全球网民数量的不断增加,移动互联网络的普及以及社交网络越来越成为人们生活中重要的一部分,互联网数据的数量正在飞速地增长。美国IDC(市场研究中心)指出,互联网数据正在以每年 50%的速度在增长,也就是说每过两年,互联网上的
16、数据便会翻一番,近几年产生的互联网数据占到一直以来的互联网数据总和的 90%。我国发布的 2012 年中国人权白皮书显示,截至 2012 年底,中国网络微博用户的人数为 3.09 亿。每天产生的论坛帖文和新闻评论达到300 多万条,在微博中每天发布和转发的信息超过 2 亿条。而在全球,平均每天通过互联网发出的邮件就会有 2940 亿封之多。IDC 预估,到了 2020 年,全世界所产生的数据规模将会达到今天的 44 倍。上述说到的传统的获取广告数据的方法主要是依赖于实地调查,收集被访者的数据以及搜寻一些二手资料。如今,在“大数据”时代下,数据来源的渠道更加多样。数据来源可以来自用户的搜索关键字
17、、在社交网络发布的文字,甚至只是简单的点击动作都可以作为用户路径的数据被记录下来。4在云计算技术的催生下,诞生了一批以提供数据解决方案的公司,像 IBM、微软、百度这些科技公司的巨头也纷纷利用自己已有的在计算机硬件上的优势以及在互联网中的地位去开拓大数据分析市场这片蓝海。美国市场研究公司 IDC 2013 年 7 月发布的报告中提到,全球大数据技术和服务市场将在未来几年保持31.7%的年复合增长率,2016 年的总规模有望达到 238 亿美元。越来越多的企业将会倾向于直接通过科技公司提供的数据收集以及分析服务去完成市场分析。澳大利亚卡夫食品有限公司旗下最有名的品牌莫过于 Vegemite。Ve
18、gemite 是一种用于涂在三文治上的食物酱,是澳大利亚人生活中不可或缺的一种食物,甚至有是澳大利亚饮食文化的象征的说法。对于这种标志性的,被誉为是国民品牌的产品,很难通过改变它的包装或者 LOGO 去提高它的消费量,于是澳大利亚卡夫食品有限公司希望通过调查除了传统的烤面包的吃法外,Vegemite 还有没有其它的用法,以此来提高 Vegemite 的销量。他们找到了 IBM 为其提供大数据与分析的解决方案。而 IBM 有基于大数据开发的一套数据分析工具,IBM 称之为COBRA(企业品牌和名誉分析 Corporate Brand and Reputation Analysis) 。这个工具可
19、以通过对数据的分析整理(包括搜索数据,社交网络数据等等)告诉企业当前的品牌情况,预估未来的发展状况,甚至还能阻截和控制企业提供给消费者的信息,企业可以选择正面的话题去扩散。在 COBRA 中,有一项数据是项目主题回复,数据的来源主要是通过整理网络上的帖子,卡夫在 15 亿个帖子中发现大约有 50 万人用 38 种语言提到了 Vegemite,其中有提到 32 种 Vegemite 的吃法。之后卡夫围绕这 32 个新发现的吃法举办了一个新的大型互动营销活动“How do you like your Vegemite”。活动的宣传包括了 TVC,公交、地铁户外广告等等。从消费者中收集到的大量信息组
20、成的数据让卡夫的决策有了依据。活动后,Vegemite 在许多店中都出现了脱销的状态,每月几千吨的销售量也创造了历史新高。基于云计算的发展, “大数据”时代下,数据处理分析的速度会大大增加,而且范围比传统的实地调查要大得多。上述提到的澳大利亚卡夫食品有限公司希望通过挖掘 Vegemite 的新用法来提高销量。传统的对与一个新的活动的市场调研需要 4 到 6 个月的时间,而且会有调查到的人群范围窄的局限。但通过 IBM 的CORBA,卡夫新的活动的调研只用了两个月的时间,而且现在的执行速度还在不断提升中。调研涉及到的人群能包含更广泛的文化背景和更多样的人口组成。除了专业的提供数据分析方案的公司外
21、,还有一批基于网站本身的数据优势,为一般的公众提供有偿或者免费的数据工具。例如百度指数,淘宝指数,量子恒道一类的数据分享平台。53 数据分享平台分析3.1 百度指数3.1.1 基本介绍百度指数诞生于 2006 年,直到 2007 年年底,百度指数 1.0 版本才正式上线。5 年后,推出了百度指数 2.0。百度指数的数据来源主要是通过网民在百度旗下(包含百度贴吧,新闻,知道等)各个板块上的行为去归纳整理而来的。随着智能手机市场的成熟,浏览手机端网页的用户越来越多,广告主以及广告公司也越来越注重移动端的发展,顺着这一趋势,2011 年,百度指数正式引入了移动端的数据。目前百度指数的数据积累,PC
22、端的为 2006 年 6 月至今,移动端的为 2011年 1 月至今。现今,一般的网民可以直接通过搜索关键词就能免费获取相关的数据,如果该关键词不存在,则需要花费 50 元新建一个关键词才能看到背后的数据。同时百度指数还为一些企业提供有偿的专业版的服务,专业版使用的数据源会整合百度全流量的数据,利用更深的数据挖掘技术,将搜索关键词按照行业,品牌,产品三大维度去细分,得到的数据会比普通版的百度指数更准确和系统。在功能上,专业版还会增加排行榜分析、竞争分析等模块,并结合不同营销阶段相应地加入了搜索词特征、人群兴趣点、网站访问及效果监测的功能。专业版更适用与一些较大型的广告主。3.1.2 平台构成百
23、度指数主要包含 4 个模块。分别是趋势研究,需求图谱,舆情管家,人群画像。趋势研究中第一个报告为指数概况,提供关键词搜索指数在最近 7 天和最近30 天的平均值,以及其同比、环比的变化趋势。通过指数概况,我们可以了解到一个关键词的受关注程度,可以作为广告投放后效果监测的参考指标之一。还能与竞品的热度进行对比,了解品牌目前在市场中的地位。趋势研究提供的第二个报告是热点趋势,热点趋势的时间跨度远远大于指数概况,用户除了可以选择最近 7 天和最近 30 天外,还能自定义时间区间。最大的时间跨度,PC 端的数据的时间起点为 2006 年,移动端的则为 2011 年。热点趋势由搜索指数和媒体指数两个部分
24、组成。搜索指数是以网民在百度的搜索量为数据基础,以关键词为统计对象,科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权和。可以让用户了解到关键词热度的持续时间,高关注度是集中在哪些时段。6图一 关键字“空调”的热点趋势以搜索关键词“空调”为例(见图一) ,会发现历年来,空调的搜索指数是在 5 月初开始快速上升,7 月中会达到一个最高值,8 月份急速下降,到 9 月初已经是接近最低值了,之后低搜索指数会一直持续到下一年的 4 月底,5 月初。从中我们可以知道空调最受人们关注的时段是 5 月初到 8 月底,所以相关空调的厂商就应该在 4 月份的时候就开始空调广告的投放,在 5 月到 8 月份
25、期间密集进行相关的营销活动。热点趋势另一个指数是媒体指数,媒体指数是以各大互联网媒体报道的新闻中,包含关键词的新闻标题作为统计标准。媒体指数展示的是新闻媒体对关键词的关注程度。同样以空调作为关键词为例,虽然也会存在随着季节的变化而产生的数值差异,但是与搜索指数相比,这种差异明显要小得多,而且媒体指数的高低与搜索指数不一定成正比。从图一可以看到,2013 年空调的媒体指数最高,在9,10 月份开始下滑,一直至今还处在一个较低的数值。具体原因还需要结合相关时间段空调市场的新闻去了解市场背后的情况。通过百度新闻的高级搜索,可以发现在 2013 年 5 月到 7 月份中,相同新闻条数最多的三条新闻分别
26、是“连续吹空调,耳朵突然聋了” , “高温刺激,空调销售额暴涨 46%”, “空调瘫痪,是修坏的” 。这三条新闻的高曝光率,很有可能会影响消费者在未来对于空调购买的决策,因此空调厂家可能在接下来的生产技术的研究上或者是广告传播策略上要侧重空调与健康的关系以及空调的高质量。百度指数第二个模块是需求图谱,通过需求图谱可以直接了解到消费者对关键字搜索的潜在需求。需求图谱分为需求分布图和热门搜索两大部分。需求分布图是针对特定关键词的相关检索词进行聚类分析而得的词云分布,纵向是环比寻求的变化,横向是需求度的强弱。热门搜索是通过对于关键词最热门相关检索词,以及上升最快的相关检索词进行排行,让广告主及时掌握
27、消费者的搜索习惯并针对相关排行结果去进行产品的研发和营销计划的制定。也能为消费者在做购买决7策时提供一个方向。图二 关键字“空调”的需求图谱从图二的需求图谱中可以看到,格力空调无论是在需求分布表中还是相关检索词排行榜中都有很不错的表现,可见人们对格力空调的关注度很高。同时与空调质量有关的检索词中,空调不制冷的问题越来越受到消费者的关注。百度指数第三个模块是舆情管家,舆情管家可以一站式呈现关键词最热门的相关新闻、微博、问题和帖子,营销活动的影响力一目了然,同时能让企业很好地了解当前消费者以及媒体对品牌或者产品的舆论,对于一些行业内部的恶意中伤或者其它潜在的舆论危机能得到更及时的处理。消费者对于品牌好的坏的评价都能在舆情管家中一览无遗。百度指数最后一个模块就是人群画像,人群画像能提供关键词搜索人群的地域分布,兴趣分布,年龄分布和性别分布。对于消费者洞察以及广告营销策略的制定都起着重要的作用。而且百度指数的人群画像的调查数据范围可以覆盖全国,得到的数据更加客观准确。