ImageVerifierCode 换一换
格式:PPT , 页数:32 ,大小:173.50KB ,
资源ID:1065187      下载积分:20 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-1065187.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于语料库的工作.ppt)为本站会员(da****u)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

基于语料库的工作.ppt

1、基于语料库的工作张宇* 1中文信息处理中文信息处理 -基于语料库的工作基于语料库的工作大纲 什么是语料库 语料库的发展简史 语料库建设中处理的问题 数据标注Date 2中文信息处理中文信息处理 -基于语料库的工作基于语料库的工作什么是语料库 语料库,英文为 Corpus 存储语言材料的仓库 现代的语料库是指存放在计算机里的原始语料文本或经过加工后带有语言学信息标注的语料文本 .Date 3中文信息处理中文信息处理 -基于语料库的工作基于语料库的工作关于语料库的三点基本认识 语料库中存放的是在语言的实际使用中真实出现过的语言材料; 语料库是以电子计算机为载体承载语言知识的基础资源; 真实语料需要

2、经过加工(分析和处理),才能成为有用的资源;Date 4中文信息处理中文信息处理 -基于语料库的工作基于语料库的工作语料库示例北京大学计算语言所富士通人民日报标注语料库样例:历史 /n 将 /d 铭记 /v 这个 /r 坐标 /n : /w 北纬 /b /m 度 /q 、 /w 东经 /b /m 度 /q ; /w 人们 /n 将 /d 铭记 /v 这 /r 一 /m 时刻 /n : /w 年 /t 月 /t 日 /t 时 /t 分 /t 。 /w 中国 /ns 政府 /nnt 顺利 /ad 恢复 /v 对 /p 香港 /ns 行使/v 主权 /n , /w 并 /c 按照 /p “/w 一国

3、两制 /j ”/w 、 /w “/w 港人治港 /l ”/w 、 /w 高度 /d 自治 /v 的 /u 方针 /n 保持 /v 香港 /ns 的 /u 繁荣 /an 稳定 /an 。 /wDate 5中文信息处理中文信息处理 -基于语料库的工作基于语料库的工作语料库的分类 生语料库 /熟语料库 生语料库 就是未经加工的 ,没有任何切分 ,标注标记的原始语料库 熟语料库 就是指经过加工 ,带有切分 ,标注标记的语料库 系统型语料库 /专用型语料库 系统型语料库 就是依据事先确定的选材原则和比例选取语料的语料库 专用型语料库 就是指专门服务于某个特定目的的语料库 单语种语料库 /多语种语料库Da

4、te 6中文信息处理中文信息处理 -基于语料库的工作基于语料库的工作语料库发展简史 第一代( 1970 80年代) 第二代( 1980 90年代) 第三代( 1990年代)Date 7中文信息处理中文信息处理 -基于语料库的工作基于语料库的工作第一代语料库 Brown语料库 LOB语料库 LLC语料库百万词级以语言研究为导向Date 8中文信息处理中文信息处理 -基于语料库的工作基于语料库的工作第二代语料库 COBUILD语料库 Longman语料库千万词级词典编纂应用导向Date 9中文信息处理中文信息处理 -基于语料库的工作基于语料库的工作第三代语料库 ACL/DCI语料库 The Association for Computational Linguistics Data Collection Initiative UPenn树库 LDC( Linguistic Data Consortium )超大规模(上亿词级)标准编码体系深度标注 /多语种 NLP应用Date 10中文信息处理中文信息处理 -基于语料库的工作基于语料库的工作

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。