ImageVerifierCode 换一换
格式:PPT , 页数:20 ,大小:3.43MB ,
资源ID:375505      下载积分:100 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-375505.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(信息技术环境下的学习活动设计研究-中文信息技术专业委员会.ppt)为本站会员(ga****84)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

信息技术环境下的学习活动设计研究-中文信息技术专业委员会.ppt

1、华中师范大学国家语言资源监测与研究中心网络媒体语言分中心涂新辉,基于排序学习的文本概念标注方法研究,人类理解自然语言的过程是一个语义概念的联想和关联的过程,这种功能是由人类大脑中几百亿个神经元构成的复杂神经网络所提供的。,大脑的语言能力,传苹果将于2012年乔布斯生日当天发布iPad 3,新闻标题,大脑概念层,苹果公司,乔布斯,iPad,苹果,苹果遭遇对手!高分辨率屏幕手机盘点,德国法院驳回苹果对三星的诉讼,平安夜吃苹果 圣诞节中国化,手机,水果市场箱装苹果缩水 纸箱被灌水泥重6斤,水果,三星公司,和人脑的基于概念的语义表征方法不同的是:“词袋”模型可以捕获文档的词语的细节,但是难以表征文档的

2、主题信息。,传统文本表征模型的困境,传苹果将于2012年乔布斯生日当天发布iPad 3,新闻标题,苹果遭遇对手!高分辨率屏幕手机盘点,德国法院驳回苹果对三星的诉讼,平安夜吃苹果 圣诞节中国化,水果市场箱装苹果缩水 纸箱被灌水泥重6斤,“词袋”模型,苹果,乔布斯,iPad,手机,水果,三星,概念是描述文本主题的非常重要的信息基于概念的文本表征可以捕获文本的主题信息,研究动机,传苹果9月发布iPhone5 年底推出全新iPad据报道,苹果将在今年9月正式发布新一代iPhone,目前该机的量产工作即将开始。苹果产业链内部人士还爆料称,苹果将在下代iPhone发布前即今年8月,推出传闻多时的7.85寸

3、mini版iPad,与此同时,今年年底时,他们还将发布新一代iPad。,在大多数文档集中并没有可以直接利用的标注好的概念本文中提出了一种利用排序学习模型自动生成概念标注的方法,基于维基百科概念的方法,概念库的构建,要建立能够表征文本中所蕴含中各种复杂主题所使用概念集合应该满足以下条件:包含覆盖不同领域主题的海量概念新的概念能够及时加入到这个概念库中这些概念应该是人可以理解的要建立和维护这样应该自然概念的集合是一个异常艰巨的任务。幸运的是,维基百科这个世界上最大的百科知识库已经满足了上面的几个要求。,概念库,?,维基百科概念库的统计信息和结构,相关背景已有的概念标注方法,基于关键词匹配(Davi

4、d Milne, 2008 等)基于内容相关性匹配(显示语义分析, Gabrilovich, 2007 ),提出新标注方法的研究动机,显示语义分析模型只考虑概念和文本的相关性,没有考虑概念本身的其它特征可能有多种特征会影响我们使用概念来表示文本,希望利用有导学习的方法让机器学习人类在使用概念来表示文本时考虑的各种因素,相关背景排序学习基本思想,当文档中的特征越来越多时,通过人工设定特征的权重信息来构建模型对文档排序的方法就难以为继了。排序学习 (Learning to rank) 的方法试图利用有导学习的方法自动建立对象的排序模型。,Ranking SVM 方法,输入是针对一组查询的偏序排序信

5、息的一组训练集合:给定概念的训练数据和相关性排序信息,我们希望找到一个权重向量尽可能多地满足以下条件:实际上,没有有效的方法找到完全满足条件的权重向量 。但是,可以把这个问题转换为一个标准的 SVM 优化问题:,特征列表,训练集生成系统,12位用户使用一个专门开发的文档段落标注系统为600个段落进行了人工标注,训练样本示例,标注完成后共得到3387个概念,平均每个段落5.6个概念。在实验中我们同时选取了未被选择的3500个概念作为反例。,自动生成的概念标注示例,和传统方法的比较,不同概念数的比较,总结,维基百科这个世界上最大的百科知识库维基百科涵盖了大部分日常使用的概念,是建立通用概念库的绝佳资源。实验表明,本章中利用Ranking SVM 排序学习算法得到的概念排序模型,比传统的文档概念映射方法在各类指标上都有相当大的提高,这个标注系统比传统的方法得到的概念标注更加接近人类的概念标注,研究中文文本的概念标注把本文中的方法应用到各类自然语言处理任务中,未来工作展望,谢谢!请各位专家指正!,

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。