1、I基于大数据的电商商品打假模式研究指导教师:陈宏 教授学生:郫县尼克扬(计算机科学与工程学院 2014666666666)摘 要消除消息不对称、建设信用制度、简化透明渠道、降低鉴定成本都是国内电子商务平台常用的打假手段。分析可知,这些措施都和大数据相关联。由于大数据的特殊性质,导致这几种措施发生了量变甚至质变,发展出的一整套的新型打假模式,即大数据打假。根据实际需求,本文按毕业设计论文的格式对基于大数据的电商商品打假模式进行研究,通过阅读有关文献和从互联网上获取相关知识和数据,主要以阿里公司进行的大数据打假为案例,重点研究如何利用大数据对电商商品进行打假、基于大数据的电商商品打假模式的特点、以
2、及结合案例分析大数据打假的两大优势。因为本人是计算机学院的大三学生,没有学习过经管学院的专业课程,所以文章中可能有相关之处不够严谨,希望您多包涵。关键词:大数据打假、电商商品、假货商品打假、阿里大数据打假目 录摘 要.I第 1 章 简介.11.1 什么是基于大数据的电商商品打假模式.11.2 如何利用大数据对电商商品进行打假.2第 2 章 大数据打假模式特点分析.32.1 基于数据智能化的打假.32.2 基于实人认证的打假.32.3 防患于未然的打假.32.4 基于统一大市场的打假.42.5 网民广泛参与、运用互联网的打假.42.6 自下而上的打假.42.7 面向信息社会的治理模式的打假.5第
3、 3 章 结合案例分析大数据打假的两大优势.73.1 分析对假货商品进行的主动防控.73.2 分析对假货商品进行的溯源追踪.8参考文献.101第 1 章 简介1.1 什么是基于大数据的电商商品打假模式假冒伪劣产品在电商中屡禁不止,除了惊人的暴利,与电商平台把关不严、盲目追求市场规模有关。目前电商总额在社会零售产品消费市场的比重越来越高,2014 年首次超过10%。据预测,到 2020 年,我国电子商务交易规模将逼近 50 万亿元,约为2010 年的 10 倍,有望成为全球第一大电子商务交易市场,其中网络零售交易额将超过 10 万亿元,占社会零售总额比重将达 16.3%。虽然假货源头在线下,但结
4、合大数据技术,电商平台仍然能够有效识别假货和侵权问题。基于大数据的电商商品打假模式,简言之,就是通过智能识别、数据抓取与交叉分析、智能追踪、大数据建模等技术手段,将假货从 10 亿量级的在线商品中捞取出来。大数据打假的最大优势,是网上的所有交易行为都留下痕迹,电商平台能够对痕迹进行分析,极大地提高打假的效率和精准度。阿里为首的电商平台是零售电商化的最大得益者,我们用阿里举例来简单介绍一下基于大数据的电商商品打假模式。目前,阿里巴巴集团目前投入在消费者保障及打假方面的员工超过 2000 人,同时还招募了来自全国各地各行业的 5400 多人的志愿者队伍,负责配合进行日常线上巡查和抽检等。通过阿里云
5、大数据处理平台 ODPS 和机器学习算法研究,阿里巴巴数据团队正在不断优化各种假货模型,已达到实时分析数据每秒 1 亿次的速度。这些模型对淘宝数百万卖家进行实时评分,识别出具有售假风险的高危用户和售假团伙。根据阿里向时代周报记者提供的数据显示,2014 年前三季度,阿里配合品牌权利人年处理 600 万条侵权商品链接,配合各级执法部门,办理侵犯知识产权案件 1000 余起,抓获犯罪嫌疑人近 400 人,涉案金额近 6 亿元。与知识产权权利人的联动层面,阿里建立了知识产权线上维权通道“IPR 投诉平台”。该平台集合了权利人资质提交验证、权属备份、反通知处理、数据分析等众多功能于一体。2014 年前
6、三季度,该系统共受理了各类权利人投诉近254 万单,删除近 600 万件涉嫌侵犯商标权、著作权及专利权的商品。1.2 如何利用大数据对电商商品进行打假大数据打假是基于互联网、物联网、大数据等高科技手段和完整的信用体系而建立的。由于平台上数据公开,所有网络行为都被记录,特别是物联网,能够对流通领域的所有的数据进行全程监控,通过构建大数据平台,可以对跟电商交易相关的产品和行为数据实现信息共享,进而提高打假效率。原本细小分散的案件,可以通过大数据分析进行整合并案,能够更精确地进行处罚。同时通过大数据分析商品的价格波动和买家评价信息,很多情况下可提前预见侵权违法现象,从而进行提前预防,减少损害。图 1
7、 大数据打假流程还是以阿里为例,利用大数据技术,阿里可以清除电商平台上被辨识出的假货,并提醒消费者不要购买;将大数据技术收集到的线索提供给线下执法部门,将打假行动从线上扩展至线下;同时,大数据技术还能根据网友的举报、权利人投诉等绘制成“打假地图”,对线下假货泛滥的区域进行重点监督与侦查,让假货没有发挥的余地。图 2 阿里大数据打假模式3第 2 章 大数据打假模式特点分析2.1 基于数据智能化的打假大数据打假是基于数据的智能化打假。它具有的优势有:通过主动防控措施可以实现防患于未然;最大限度地实现信息公开透明,使侵权人无处藏身;对于细小分散的违法案件,可以实现并案处理,加大了处罚和打击力度;由于
8、信息的可追溯,可以通过智能化手段提高打假的效率和准确度;利用物联网和“一品一码”,可以实现全过程的监控。这些措施和效果,都是线下的打假活动无法实现的。而且,在网络上打假的另一个优势,是网上的所有行为都记载在案,可有效运用大数据的手段进行分析、汇集和整合,从而发现蛛丝马迹,使制假售假者无处遁行。以微信为例。2014 年 12 月,腾讯在反信息诈骗联盟成立一周年之际,又推出腾讯手机管家天下无贼 2.0 版本,并发布反信息诈骗白皮书,力图打通大数据建立精准反诈骗平台。腾讯副总裁罗道锋透露,反信息诈骗平台上线一年,收集的用户举报、标记的诈骗电话、诈骗短信数量均超过了 7000 万。 2.2 基于实人认
9、证的打假大数据打假是基于实人认证的打假,很容易理解,比如阿里巴巴,它的实名认证体系包括淘宝注册、支付宝账号绑定认定、开店须用身份证认证、利用手机或数字证书的二次认证、复核这五个环节。2.3 防患于未然的打假大数据打假是防患于未然的打假。由于大数据打假是基于互联网、物联网、大数据等高科技手段和完整的信用体系而建立的,通过大数据分析,很多情况下都可以预见到侵权违法现象的发生,从而起到提前预防的作用,减少损害。这也是大数据打假不同于一般线下打假模式的重要特点之一。2013 年,淘宝网在主动打击假货方面运用了一系列人性化的处理,例如在商品发布的时候,对可能涉及侵犯知识产权的用户进行提醒。同时,还建立了
10、4一个“体检中心”,对可疑的商品,会进行拦截并放入“体检中心”,同时提示卖家进行调整或者提供申诉的材料。通过一系列的卖家转型计划实施,包括一些线下的面对面的辅导和帮助的实施,并在处罚与教育相结合的过程中,进行“初犯”教育和警示,实施“累犯从重”的管理方式,已有 25%的售假卖家不再出售假货。2.4 基于统一大市场的打假大数据打假是基于统一大市场的打假。我们不妨问这样一个问题,市场集中度的高和低,哪样更有利于打假?显然答案应该是前者,当万千假货藏身于千店万市的时候,打假的成本之高、难度之大可想而知。电子商务恰恰给予了我们这样一个绝佳的打假机会,不需要任何成本,只要辅之以足够强劲的技术手段,至少表
11、象层面的假货都会一览无余,这难道不是我们打假和根治假货问题千载难逢的时机吗?2.5 网民广泛参与、运用互联网思维的打假大数据打假是网民广泛参与、运用互联网思维的打假。首先,电子商务助力打假的另一个重要方面就是群策群力,充分发挥广大网民的力量。比如淘宝,目前它既有“神秘买家”制度,又和众多的专业检测机构合作,与 3 万多名权利人、数十家行业协会和国际组织合作,织成了一张打假的巨大罗网。2.6 自下而上的打假大数据打假是自下而上的打假。发达的市场经济和商品经济,带来的一个弊端就是假冒伪劣的易发。基于这种特性,假货的治理往往只依靠法律是不够的。“高大上”的法律,对于深藏于每一个乡村和山沟的生产作坊而
12、言,难免有种“天高皇帝远”的感觉。将小生产者组织起来,一起提高质量、创立品牌、5规范流程等工作,无法靠法律实现。这时候我们就应该看到,在国外的假货治理中的重要角色商会,像德国的法兰克福商会、科隆商会等,都有着成功案例。在我国治理假货的成功经验中,广西宾阳、浙江温州当地的商会和协会也都发挥了重要的作用。而今天的电子商务时代,基于网络的商盟不断涌现,再辅之以网规和信用的作用,一种全新且有效的自下而上的治理模式正在形成,成为网络打假的生力军。所以,在打假这个典型的治理问题面前,政府一定要抛开传统的亲力亲为治理模式,运用互联网思维,调动最多的力量帮助自己,才有可能在根本上开创崭新的局面。2.7 面向信
13、息社会的治理模式的打假最后,大数据打假是面向信息社会的治理模式的打假。比较线上线下两种治理模式的主要区别,归纳出 4 种治理要素:主体、客体、内容和载体。主体、客体和载体存在虚拟化和跨区域和行业的变化;内容存在多样化和个性化、海量、即时的变化;在治理手段上,需要解决虚拟化、跨区域和行业以及海量、个性化等问题。这些挑战都是线下所不存在,需要在治理理念、手段和组织架构等方面不断创新,探索真正适合电子商务的监管模式。更进一步可以发现,第一,线上的治理手段更多样。比如,像淘宝规则里例如“扣分”“关小黑屋”、限制上线新产品数量等等这样的治理手段,在线下是不可想象的;第二,线上的治理分布比较均衡,而线下的
14、治理集中在交易后,交易前和交易中的办法不多;基于信息透明和交易记录,线上可以带来很多防患于未然的措施;第三,线上的治理是多元化治理:包括主体多元和手段多元两个层面;第四,线上的治理是全方位的,线下往往只监管卖家,无法监6管买家,而线上的买家也可以有信用记录,可以设置“黑名单”,对于职业差评师等,也可以有法律责任追究机制;第五,线上治理的对象更多,虽然线下也会有商场、支付等服务者,但线上又多出了交易平台、第三方支付、物流配送、网络接入、电脑手机厂商、软件厂商、搜索引擎等诸多新的主体;第六,线上的治理是跨时空的,有很强的延展性。跨空间很好理解;所谓的跨时间是指所有以前的交易记录都有据可查,以后的交
15、易也可以通过信用来控制。而线下的治理停留在一个时空的特定节点,伸缩性很差,基本就是“就事论事”。7第 3 章 结合案例分析大数据打假的两大优势3.1 分析对假货商品进行的主动防控对假货商品进行主动防控。无论是线上线下,打假面临的一个很大的挑战是,如何揭开假货商品的“伪装”,将其与正常商品区别开来,避免其流入消费者手中,这就是对假货商品进行主动防控。鉴于假货制造者生产假货的过程中已经给假货加了种种伪装,故意“假冒为真”,在商品数量以 10 亿为单位的大型平台上,想要去伪存真,其难度可想而知。但是,借助于大数据,平台可以建立起一套有效的假货主动防控系统,把假货从海量商品中分离出来。这套系统,简而言
16、之,就是利用平台沉淀的海量数据,进行大数据建模,建立假货识别模型,从而识别假货。依靠智能识别和庞大的商品样本数据库对交易对象进行精细筛查,平台能够在初期就筛掉一些售假商家。阿里巴巴目前已经建立了图片侵权假货识别系统,还在进一步开发人脸和声纹特征数据库。近三年来,阿里巴巴收集了 100 万张图片,每周发现疑似假货的数量在 10 万20 万件之间。利用大数据,平台也具备了打击网络黑色产业链的能力,其通过模拟攻击技术手段,进行前置化的预防工作,保护网络用户的信息安全。腾讯公司利用微信软件设立的举报、拦截技术,监控微信平台上的可疑信息。利用平台公司的数据库,从大数据中发现异常线索。通过微信、微博账号关
17、联的手机号码、邮箱、QQ 账号以及微店关联的淘宝店铺等信息确定售假者身份,对于那些经常性流动上网的售假者,通过物流逆向查找寄件人信息确定其8常住地。案例 1:阿里巴巴以大数据为基础的假货主动防控模式以往排查假货信息是靠搜索关键词来确定的,这么做工程量大,准确率低。这两年,阿里巴巴安全技术人员开发的文本识别引擎已经升级为语法语义分析,在引入了机器学习算法后,能够取代之前的人工排查,做到全网数据监控和检索,支持多达 60 个维度的组合条件筛选,每天消息处理量 2 亿条以上。2013 年开始,阿里巴巴逐步建立了专业的图片侵权假货识别系统,通过图片算法技术实时扫描,可以通过检测图片中的局部 Logo
18、来识别图片中商品的品牌,进而判断该商品是否为假货。目前淘宝收集的各类违规假货样本的图库在 100 万左右,系统每天调用超过 3 亿次。在阿里巴巴平台,有数以亿计的活跃买家,这些买家也是阿里安全部判断是否“疑似假货”的依据之一。这种被戏称为“海底捞”的技术实名是数据提取和交叉分析。阿里巴巴利用“海底捞”的各种模型,捞取主动防控所需信息,使得平台假货得到管控、消费者利益得到保障。”3.2 分析对假货商品进行的溯源追踪利用大数据对假货溯源追踪。平台基于大数据对假货的主动防控,解决还是线上的问题,但假货的源头在线下,假货的生产,以及制假者和售假者都在线下存在,仅仅删除平台上假货信息并不能从根本上打击假货,需要从源头进行打击。在这方面,大数据又为平台打假提供了利器。利用大数据,平台可以从两个层面对假货进行溯源追踪。利用平台上沉淀的海量数据,平台在数据挖掘基础上,可以对平台上的售假者进行多个维度的定位,令售假者的行为无处可藏。