1、1直播平台如何有效进行弹幕管理如果要评选 2016 年最火爆的互联网产品,一定非直播平台莫属。据相关数据显示,截至 2016 年底,大大小小的直播平台已经达到 300 多家。然而其疯狂扩张、野蛮生长的同时也滋生了很多问题,部分直播平台传播色情、暴力、谣言、诈骗等信息,违背社会主义核心价值观,特别是给青少年身心健康带来了不良影响。 鉴于此,直播平台也采取了多种措施监管主播行为,比如斗鱼就推出了 12 分主播扣分制系统,并完善了相关举报机制和直播间管理方法,以维护平台的健康秩序。除了主播层面,弹幕作为直播平台拉动主播与观众最主要的互动方式,作为满足用户社交需求的最重要的手段,问题也非常突出。基本上
2、,所有直播平台或多或少都充斥着黄暴、骂战、恶意刷屏等违规弹幕,严重影响了用户观看直播的体验,传递了不良的社会价值观,影响了直播平台的声誉,使企业随时面临风险。目前尚未见到直播平台有明文的弹幕管理方案出台,亟待政府部门加强监管引导;直播平台自身也要提高重视,从技术、人力、机制等方面加大投入,屏蔽违规弹幕,保证绿色健康发展。 2016 年 11 月 4 日, 互联网直播服务管理规定由国家互联网信息办公室发布,第十一条明确规定, “互联网直播服务提供者应当加强对评论、弹幕等直播互动环节的实时管理,配备相应管理人员。用户在参与直播互动时,应当遵守法律法规,文明互动,理性表达。 ”互联网生态复2杂多变,
3、一个行业要长足发展,必然需要走向规范。睁一只眼闭一只眼的时代已经过去,自觉遵守行业法规,做好自身的内容监管是每个直播平台应尽的责任,也是其健康良性发展的根基。 违规弹幕处理的特点与难点 数量庞大。直播过程中,观众除了被封禁或者禁言外,都可以通过手机、Pad、PC 等设备不限条数、不限地点地随时发弹幕。调侃聊天,参与互动,弹幕可以围绕主播以及主播直播的内容展开,也可以发散开去,天马行空,聊完全不相干的话题。发送弹幕的便捷性及互动内容的随意性决定了热门直播间的弹幕数量非常庞大,部分主播的直播间观众开启弹幕后可能都完全看不到画面。 实时性。弹幕之所以叫弹幕,就是因为它一发出来就从屏幕上像子弹一样一闪
4、而过。目前绝大多数直播平台的弹幕都是实时的,这种实时性要求弹幕的违规处理必须前置,根据规则进行过滤,不进行展示,才能达到完美效果,后期发现了再处理只能是补救措施。这种实时性的需求也加大了弹幕管理的难度。 隐蔽性。现在的弹幕形式多种多样,可以发在不同的位置,用不同的颜色,也可以通过代码制作一般弹幕无法做到的功能和形状。部分违规弹幕往往同大量彩色弹幕一起出现,或者出现在比较不引人注意的位置,逃过审核人的审查;有的甚至在发违规弹幕时增加房间的弹幕厚度,或者先发一些高级弹幕干扰巡查审核人员。 文本的不规范性。弹幕作为一种青年亚文化的表现形式,其语言的表达往往过于随意,无标点,且存在大量非传统字典所包含
5、的词汇,这3在很大程度上增加了机器通过语义和字典匹配来进行机械切分的难度。 弹幕管理的正规化与标准化 直播大战硝烟弥漫,比内容,比产品,更是比谁能更早一步迈向正规,走向规范。任何行业都有标杆,都有标准,而最先走向正规、走向规范的那一拨人就是标杆,就是制定标准的人。弹幕管理的正规化、标准化正是其中的重要一步。 首先是技术过滤。包括敏感词拦截、词库过滤、按用户屏蔽弹幕、规则引擎以及文本挖掘、语义分析等。 敏感词拦截:目前几乎所有的直播平台都有自己的敏感词库,系统自动通过敏感词匹配达到拦截违规弹幕的目的。事实证明敏感词拦截是非常有效的弹幕管理方式,从斗鱼 TV 每天的弹幕拦截记录及拦截处理记录都可以
6、看出,敏感词弹幕的拦截量非常大,占到整站拦截弹幕的 90%以上,且准确率极高,被系统误拦截的情况比例极小。但是敏感词过滤的缺点也很明显,其查全率完全依赖于敏感词汇的丰富程度。除了积累大量的敏感词外,敏感词的同义词、近义词、变形变换词都需要长期积累,不断更新。对于初创建的直播平台,敏感词库从无到有,从少到多,需要一个长期的积累过程。 词库过滤:弹幕中除了有明显违规的敏感词外,还充斥着大量毫无意义的特殊字符。这种内容虽然无伤大雅,但是却极大地影响了用户对平台的评价,进而选择弹幕质量更高的直播平台观看。通过过滤词库虽然能够将弹幕中匹配的字符过滤掉,留下有实质意义的文字,但是很容易误伤高级弹幕,使得高
7、级弹幕不完整,意义无法识别;很多特殊字符4在弹幕文化的语境中有其独特的情感含义,有的甚至有实际的意义,过滤后弹幕语义会发生改变;过滤词库仅过滤匹配的字符,弹幕的其他内容仍然保留,一般也没有合理的方式通知用户,用户会误以为系统有Bug(缺陷或问题) ;同时,过滤词库跟直播平台畅所欲言的自由特质略有冲突。所以使用过滤词库需要慎重,每加一个字符都要认真观察。 按用户屏蔽弹幕:系统对黑名单用户弹幕全部屏蔽的做法也是直播平台弹幕过滤较常用的做法,甚至有的会有用户禁言黑名单。同敏感词库一样,黑名单的建立也需要运营人员长期摸索,不断发现,并不断更新修正。斗鱼 TV 除了支持按用户黑名单屏蔽弹幕,也支持按 I
8、P 屏蔽,通过多种方式保证弹幕安全。 规则引擎:据了解,Acfun、哔哩哔哩在前端页面对用户开放了通过正则表达式屏蔽弹幕的功能。其实规则引擎也可以应用于直播平台整个弹幕管理中。违规弹幕总免不了呈现出某些规则特性,通过一段时间的审核处理实战,要发现这些规则并非难事。比如打人弹幕,常用表达是“不管怎么?哟蛄嗽偎怠薄白苤?先打一顿再说” “不管这些了,打了再说”其规则就是先出现“打”字,然后跟着出现“再说” ,考虑到“再”字可能很多人会写错,所以这个正则的表达式可以为:打.*再在说。规则匹配相对关键词来说,更具精确性,可以达到更加细化的匹配效果,但是对运营的要求更高,运营除了要总结违规弹幕所呈现的规则,还需要学习正则表达式,并根据匹配结果调整表达式,减少误伤。