1、,微博情感分析评测总结,第一届自然语言处理与中文计算会议,2012年11月2日,1北京大学计算机科学技术研究所2苏州大学计算机科学与技术学院3哈工大深圳研究生院计算机科学与技术学科部,万小军1、李寿山2、徐睿峰3,任务设置,观点句识别情感倾向性判断针对观点句情感要素抽取针对观点句,数据集,来自腾讯微博数据原始数据集20话题主要是热门事件,如“三亚春节宰客”约17500条微博约32000个句子,数据集,数据标注三标注者对同一数据标注数据集大小2023条微博3416个句子1209个非观点句2207个观点句407正面、1766负面、34其他2361个对象441正面、1910负面、10其他,数据集,标
2、注标准关于观点句个人意愿、心情不是观点句,如“我感到很高兴”表达了明显观点的反问句属于观点句,如“体育竞技有不残酷的吗?”关于观点句倾向性正面、负面,其他(Other)三类,“其他”表示中性或无法确定正负的情况不进行,数据集,标注标准关于观点句情感对象情感对象优先从当前句子抽取,但可以跨越当前句子从前面的句子或后面的句子中抽取(前面的邻近句子优先)情感对象尽可能完整和明确,事件按细粒度标注: “ipad的屏幕很棒!”- “ipad的屏幕” “官二代陶汝坤:作案动机极其卑劣”- “作案动机”对象本身不是情感表达: ”#官二代求爱不成将少女毁容# 这种畜生是怎么被教育出来的啊!” - “官二代”人
3、称代词需要尽可能在当前微博内进行指代消解: “小明就读于北京大学,他是名优秀的学生。”-”小明“抽取出句子中每个情感片段所对应的情感对象: “你根本已经不是个人了,你比蛇还冷血,你比畜生还畜生。” - “你” “你” “你”,参评单位,34支队伍包括全国重点高校与科研机构观点句识别:53组情感倾向判断:48组情感对象抽取:22组,观点句识别,任务要求识别每条微博中各个句子是观点句还是非观点句评价标准准确率、召回率、F值微平均宏平均,观点句识别,微平均,观点句识别,微平均,观点句识别,宏平均,观点句识别,宏平均,情感倾向性判断,任务要求判断微博中每条观点句的情感倾向正面、负面、其他评价标准准确率
4、、召回率、F值微平均宏平均,情感倾向性判断,微平均,情感倾向性判断,微平均,情感倾向性判断,宏平均,情感倾向性判断,宏平均,情感要素抽取,任务要求找出微博中每条观点句作者的评价对象判断针对情感对象的观点极性评价标准精确评价宽松评价准确率、召回率、F值,情感要素抽取,严格评价微平均,情感要素抽取,严格评价微平均,情感要素抽取,严格评价宏平均,情感要素抽取,严格评价宏平均,情感要素抽取,宽松评价微平均,情感要素抽取,宽松评价微平均,情感要素抽取,宽松评价宏平均,情感要素抽取,宽松评价宏平均,小结,微博情感分析相当具有挑战性不同于产品评论数据,微博数据领域多样,话题广泛,表达自由本次评测中微博观点句识别、倾向性分析的最好结果F值接近于80%,情感要素抽取的最好结果精确评价F值接近于30%,比预想的结果要好,但仍有较大的提升空间本次评测的标注数据可作为相关研究的科研数据,已免费公开发布标注规范和任务设置有待进一步的改进,27,致谢,感谢腾讯微博提供数据!感谢北京大学、苏州大学、哈工大深圳研究生院的老师和同学进行数据标注与测评!感谢评测参与单位的支持和意见反馈!,28,