1、基于依存分析的中文微博情感分析,汇报人:周学广 教授E-mail:,汇报内容,任务三,情感要素抽取评测,任务一:观点句识别评测,为了有效区分观点句与非观点句,我们从句子中抽取组件对应的词语特征作为识别线索,并在情感词和评价对象的依存模式的基础上,提出基于词语特征的观点句识别方法-OSR_WF方法。,任务一:观点句识别评测,OSR_WF方法流程:,新词识别;含极性词库中的词,则认为该句子是观点句;主语为第一人称代词,谓语为主张动词,状语为表达“喜、 怒、哀、乐”的情感词的句子认为不是观点句;含有能愿动词库中的词作谓语的句子认为不是观点句;由条件连词库中的词作连词的句子认为不是观点句;其它符合评价
2、单元依存模式的句子认为是观点句。,规则制定:制定组合模式 构建非语素词性集 构建停用词表候选新词剪枝:成词权重统计: 转移频率和文档频数,计算成词权重:,提出基于规则与统计的新词识别方法,任务一:观点句识别评测,情感词库 极性词库 否定词库能愿动词库条件连词库,词库构建:,任务一:观点句识别评测,评价单元依存模式,任务一:观点句识别评测,任务一:观点句识别评测,任务二:情感倾向性判断评测,线性相加法,统计观点句中情感倾向性值,句子从左往右,含褒义情感词+1,含贬义情感词-1,出现“但、但是”连词,将情感倾向性值清零,从转折后继续计算,最后得到句子的倾向,大于0判断为POS,小于0判断为NEG,
3、等于0为OTHER。,任务二:情感倾向性判断评测,获取候选情感词和候选评价对象;采用评价单元依存模式对候选评价单元进行筛选;通过评价对象归并算法得到完整的评价对象。,基于依存模式的情感要素抽取方法,任务三:情感要素抽取评测,-SFE_DM 方法,评价对象归并算法,任务三:情感要素抽取评测,为区分原始的评价对象和归并后得到的评价对象,将原始的评价对象称为评价对象基准词。评价对象归并时从评价对象基准词的左邻词开始,从右往左依次判断,若其父亲节点为基准词或为其右邻词,将其归并到评价对象中;若为句首或其父亲节点不为基准词或不为其右邻词时停止归并。,任务三:情感要素抽取评测,严格评价指标下结果:,任务三:情感要素抽取评测,任务三:情感要素抽取评测,宽松评价指标下结果:,任务3结果与分析(宽松评价),汇报完毕,谢谢大家!,