ImageVerifierCode 换一换
格式:PPT , 页数:25 ,大小:1.29MB ,
资源ID:333106      下载积分:100 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-333106.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于Web的比较式挖掘研究-中文信息技术专业委员会.ppt)为本站会员(ga****84)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

基于Web的比较式挖掘研究-中文信息技术专业委员会.ppt

1、基于协同图排序的对比新闻自动摘要,黄小江 万小军 肖建国北京大学计算机科学技术研究所,研究背景,比较是一种重要的认知方式优劣、趋势、规律互联网媒体的迅速发展新闻分析技术的快速进步主题检测、相关推荐,2,任务定义,比较语义两个或多个对象在某个维度上的相同/不同形式相对描述智利比海地贫困绝对描述智利是一个富裕国家海地是一个极度贫困的国家,3,任务定义,新闻话题一个种子事件或活动所有直接相关的事件和活动例:地震发生救援重建,4,任务定义,新闻话题对比相关话题奥巴马竞选活动罗姆尼竞选活动相关新闻要素筹款能力经济主张外交主张,5,任务定义,对比新闻摘要内容概括两个可比话题之间的共同点和不同点形式两部分文

2、本每部分描述一个话题两部分讨论话题中可比较的特性要求对比性、代表性、全面性、可读性,6,任务定义,对比新闻摘要,北京时间5月12日14时28分,位于北纬31度、东经103.4度的四川省汶川县发生里氏7.8级地震,造成重大人员伤亡和重大财产损失。截至13日7时,四川汶川县地震已造成四川、甘肃、陕西、重庆、云南、山西、贵州、湖北8省市共11921人遇难,倒塌房屋50余万间。至15日上午,参与救援行动的解放军和武警官兵、公安民警、干部群众和医务工作者等救援人员已从灾区抢救出伤员6万多人。,4月14日7时49分,青海省玉树藏族自治州玉树县发生7.1级地震,给当地人民群众生命财产造成严重 损失。截至北京

3、时间15日上午9时,发生在中国青海玉树的地震已经造成617人遇难,313人失踪,9110 人受伤,其中,970人伤势严重。截至17日,已调集至玉树震灾现场的各类救援人员达到15000余 人,累计搜救营救被困群众17000人。,7,基于协同图排序的摘要方法,摘要系统框架,新闻话题1,新闻话题2,预处理,句子挑选,对比性,代表性,全面性,句子排序,对比摘要,8,基于协同图排序的摘要方法,句子重要性对比性与对比话题中的其他重要句子具有强对比性,则此句子重要代表性与本话题中的其他重要句子具有强相似性,则此句子重要,9,基于协同图排序的摘要方法,句子重要性,10,基于协同图排序的摘要方法,句子关系图,1

4、1,基于协同图排序的摘要方法,话题内代表关系基于句子之间的相似度tfisf 模型,12,基于协同图排序的摘要方法,话题间对比关系对比程度讨论事件属性的相关性梅西获得了2010 年世界足球先生称号C.罗纳尔多是2009 年世界足球先生比较点(属性名):名词/动词性比较结果(属性值):形容词/副词/数词性,13,基于协同图排序的摘要方法,话题间对比关系保留名词、动词tfisf 模型,14,基于协同图排序的摘要方法,句子重要性,对比性,代表性,15,基于协同图排序的摘要方法,句子选择贪心算法排序值更新提升不同话题中的可比句子得分(可比性)惩罚相同话题内的相似句子得分(冗余性),16,实验评估,数据集

5、5组英文话题,17,实验评估,数据集5组中文话题,18,实验评估,评价方法ROUGE基于候选摘要与参考摘要之间的重叠程度ROUGE-2, ROUGE-SU4M-ROUGE两部分摘要的ROUGE平均M-ROUGE-2, M-ROUGE-SU4,19,实验评估,摘要模型Manifold/M: 传统摘要,混合抽取Manifold/S: 传统摘要,分别抽取CoRank/S: 协同图计算,分别抽取CoRank/U: 协同图计算,统一抽取,20,实验评估,实验结果(英文),21,实验评估,实验结果(中文),22,23,北京时间5 月12 日14 时28 分, 位于北纬31 度、东经103.4度的四川省汶川

6、县发生里氏7.8 级地震, 造成重大人员伤亡和重大财产损失 。地震发生后, 9000 多名解放军和武警官兵紧急调动赶赴地震灾区参加救灾行动。中国地震局启动了一级预案, 由184 人组成的国家地震灾害紧急救援队和40 人组成的国家地震灾害现场工作队已抵达成都, 正连夜乘坐军用卡车奔赴汶川地震灾区。汶川县干部群众正奋力抗震抢险。国家民政部会同财政部向四川地震灾区紧急下拨 2 亿元中央自然灾害生活补助应急资金, 帮助地震灾区群众解决生活困难。,4 月14 日7 时49 分, 青海省玉树藏族自治州玉树县 发生7.1 级地震, 给当地人民群众生命财产造成严重 损失。另据中国地震网消息, 在7 时49 分的7.1 级地震前, 还连续发生数次4 级以上地震。地震发生后, 根据国务院的指示, 中国地震局下达了派遣地震灾害紧急救援队伍的命令, 启动地震应急救援协作联动机制, 命令国家地震灾害紧急救援 队和青海、西藏、甘肃、陕西、宁夏等地震灾害紧急救援队和现场应急工作队伍赶赴地震灾区开展抢险救援工作。玉树地震发生后, 不少单位和个人纷纷伸出援手, 为地震灾区群众捐款捐物。,结论&展望,结论利用对比性和代表性,相互增强计算重要程度摘要句抽取考虑对比性和信息冗余展望引入语义信息,计算句子之间的对比程度区分话题之间的共同点和不同点多话题、跨语言新闻对比,24,Q&A,谢谢!,25 / 76,

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。