1、,基于情绪因子的中文微博情绪识别与分类,张晶 朱波 梁琳琳 侯敏 滕永林,2013年11月18-19日,汇报内容,CUCeas系统工作流程,结语,什么是情绪因子,情绪词情绪短语情绪表达式微博表情符号标点符号,如:好多人都走了,感觉好心酸。,如:给脸不要脸,把我iPad 弄丢了也不赔。,如:原来霍华德只比我高一个头啊。,如:心形的叶子呀,(太开心),如: a.真有这样的事。 b.真有这样的事?,系统结构图,CUCeas系统,词典,规则,解释器,词典系统的构建,词典系统,分词词典,情绪词典,情绪词典,情绪词,情绪短语,系统结构图,CUCeas系统,词典,规则,解释器,规则系统的构建,规则系统,短语
2、规则,句子规则,微博规则,主要解决给情绪因子赋情绪类别值的问题,有情绪词语的情绪句的处理,没有情绪词语的情绪句的处理,情绪类别值的消解和改变,例子:今天在机场看到了来打季前赛的科比,好开心呀!,根据短语规则给情绪因子赋予情绪类别值:*/emo = N1 情绪类别:happiness,在短语赋值基础上解决给句子赋类别值的问题,在句子赋值基础上解决给微博赋类别值的问题,例子:关系到孩子的健康,没有情绪词语的情绪句的处理,怎么敢如此忽视?,怎么/% #0:1敢/% 如此/% #*/!w ?|!/w = #1:ang,根据如下短语规则:,规则系统,规则系统的构建,短语规则,句子规则,微博规则,出现情绪
3、词语的情绪句的处理,没有情绪词语的情绪句的处理,情绪类别值的消解和改变,情绪类别值的消解,例子,我们之所以会痛苦,就是追求太多。,我们之所以不快乐,就是计较太多。,情绪词,悲伤(sadness),喜悦(happiness),非情绪句,根据规则: 之所以/% 会|不/% */emo = #3:0,规则系统,规则系统的构建,短语规则,句子规则,微博规则,有情绪词语的情绪句的处理,没有情绪词语的情绪句的处理,情绪类别值的消解和改变,例子:今天在机场看到了来打季前赛的科比,好开心呀!,1.根据短语规则给情绪词赋予情绪类别值:*/emo = N1 情绪类别:happiness,2.根据句子规则进行句子情
4、绪计算:VL = N1 情绪类别:happiness,根据短语规则计算的结果赋予句子情绪类别值,确定句子中的主要和次要情绪,哈尔滨的冰雕真美,即将要离开,虽然有点淡淡的忧伤,但是还是很开心。,1.根据短语规则给情绪词赋予情绪类别值:*/emo = N1 忧伤:sadness 开心:happiness,2.根据句子规则确定主要和次要情绪:虽然/% VL 但是/% VL = em1:N4 em2:N2主要情绪:happiness 次要情绪:sadness,CUCeas系统工作流程,评测结果,语料:CCF第二届自然语言处理与中文计算会议中文微博情绪分析评测提供的微博测试语料。评测:参加了该评测任务的全部三个子任务的open测试微博情绪识别、微博情绪判断、情绪句情绪识别。,微博情绪判断任务结果,微博情绪识别任务结果,情绪句情绪识别任务结果,结语,本文提出了“情绪因子”的概念。情绪因子包含情绪词、情绪短语、情绪表达式、标点符号、表情符号五种主要表达手段,基于情绪因子构建了情绪词典和情绪规则,实现了对中文微博情绪的识别和分类,取得了较好的效果,证明了该方法的有效性。,谢谢!,