ImageVerifierCode 换一换
格式:PPS , 页数:43 ,大小:332KB ,
资源ID:1106164      下载积分:20 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-1106164.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(关于统计机器翻译的思考.pps)为本站会员(da****u)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

关于统计机器翻译的思考.pps

1、关于统计机器翻译的思考姚天顺自然语言处理实验室东北大学2004.7.111. 前言有这么两条消息:5月 10日 参考消息 “ 随着又有 10个国家加入欧盟,欧盟现有 20种官方语言。年度翻译预算增加到 10亿美元。 ”5月 28日 参考消息 “ 欧盟新通过一项议案,所有成员国在欧盟会议上的文件不得超过 15页 A4纸,以减轻翻译人员的工作量 。 ”机器翻译的现状和未来到底怎么样了?有计算机的那一天就有机器翻译的研究。计算机事业蓬勃发展,但机器翻译的道路至今仍然十分艰难。上世纪的八十年代,特别是九十年代,语料库语言学在计算语言学界兴起。最近的五年到十年,机器学习方法又受到学术界特别的重视,数学方

2、法大量地引进了语言信息处理。自然语言处理的研究是进了一大步,但对于机器翻译而言,真实的效果在哪里呢?回忆基于规则的机器翻译系统作为主流技术的时代,不管怎么样?多少还出现过一些有市场价值的系统,例如译星、华建和史晓东等的汉英翻译系统。 华建的机器翻译,居然取得了国内单项软件出口的最高出售价。欧洲和日本情况也是这样,当前主流的机器翻译还都是基于规则的机器翻译系统。基于语料库的机器翻译方法,一般说来可以分为两类:一类是基于统计的机器翻译系统,另一类和基于模板的机器翻译方法。基于统计的机器翻译,简称为统计机器翻译。统计机器翻译把源语言中任何一个句子都可能是目标语言中某些句子相似,这些句子的相似程度可能

3、都不相同。那么,一个好的机器翻译系统就是那种能找到最相似句子的系统。但是这样的汉外机器翻译系统在我们国家从来也没有出现过。1994年, IBM公司的 A. Berger, P. Brown 等人发表了一个技术报告,即著名的论文:“ The candide System of Machine Translation。 ”他们用统计方法,各种不同的对齐技术,给出了命名为 Candide的统计机器翻译系统 .利用汉莎语料库( Hansard corpus, 英法双语语料库),总共有 2,205,733 英法句对作为训练语料,实现了国际上第一个较为著名的英语到法语的统计机器翻译系统。一开始,系统的成绩

4、不错,整体的系统的译准率超过了基于解释、转换、和生成的规则系统。ARPA( 美国国防部高级研究计划署)把这个 Candide 翻译系统进行评测,并和国际上利用常规的规则系统构造的 SYSTRAN 机器翻译系统作比较,结果是,流利程度 适当程度 时间比率率 1992 1993 1992 1993 1992 1993SYSTRAN .466 .540 .686 .743 Candide .511 .580 .575 .670 Transman .819 .838 .837 .850 .688 .625Manual .833 .840 Transman is the part of the Candide system used as a translation assis-tance tool, i.e. a machine-aided translation system. 这个结果很了不起,在某种程度上推动了经验主义思潮更进一步向前发展。由于计算语言的复杂性, Candide系统还请了一些语言学家来帮助他们做形态分析、语义标注、和词典等。Candide系统仍不是一个纯统计的系统。这样的系统,看来很有希望,不知为什么,由于 IBM 公司外部和内部财政方面的原因,支持被撤走,他们的工作坚持到 1995年,就被迫停止。呼声很高的系统被中断了。有人说,纯统计的机器翻译注定是要失败的!

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。