1、自然语言处理Natural Language Processing(NLP)陈家骏,戴新宇主要内容( 1)p 自然语言处理概述n 什么是自然语言处理n 自然语言处理技术的应用n 自然语言处理的基本策略和实现方法n 自然语言处理的难点n 自然语言处理所涉及的学科(http:/ 基于规则的自然语言处理方法( 理性方法 ,传统方法)n 基于词典和规则的形态还原(英语)、词性标注以及分词(汉语、日语)n 基于 CFG(上下文无关文法)和扩充的 CFG(复杂特征集、合一运算)的句法表示及其分析技术n 基于逻辑形式和格语法的句义分析n 基于规则的机器翻译(http:/ 2)p 基于语料库的自然语言处理方法
2、( 经验方法 )n 语言模型( N元文法)n 分词、词性标注(序列化标注模型)n 句法分析( 概率上下文无关模型 )n 文本分类(朴素贝叶斯模型、最大熵模型)n 机器翻译 (IBM Model等 )n .(基于神经网络的深度学习方法)主要内容( 3)所需的前导知识p 编译技术p 概率与统计参考书籍p 宗成庆, 统计自然语言处理 , 清华大学出版社 , 2008p 刘群等译, 自然语言理解(第二版) ,电子工业出版社, 2005p 苑春法等译, 统计自然语言处理基础 ,电子工业出版社, 2005p 冯志伟等译, 自然语言处理综论 ,电子工业出版社, 2005p 黄昌宁等, 语料库语言学 ,商务印
3、书馆, 2002p 冯志伟, 计算语言学基础 ,商务印书馆, 2001p 余士文, 计算语言学概论 ,商务印书馆, 2003p 姚天顺, 自然语言理解一种让机器懂得人类语言的研究(第2版) ,清华大学出版社, 2002p 赵铁军等, 机器翻译原理 ,哈尔滨工业大学出版社, 2000p 宗成庆等译, 统计机器翻译 ,电子工业出版社, 2012p Peter F. Brown, et al., A Statistical Approach to MT, Computational Linguistics, 1990,16(2)课程考核p Projectsn 提交报告(说明基本做法)和源程序及可运行
4、的程序p 期末笔试自然语言处理概述什么是自然语言处理p 充分利用信息将会给人们带来巨大的收益,而大量的信息以 自然语言 (英语、汉语等)形式存在。p 如何 有效 地获取和利用以 自然语言形式 出现的 信息?n 自然语言处理 ( Natural Language Processing,简称 NLP)是指用计算机对语言信息进行处理的方法和技术。p 与 NLP相近的两个研究领域:n 自然语言理解 (Natural Language Understanding, NLU):强调对语言含义和意图的深层次解释n 计算语言学 (Computational Linguistics, CL):强调可计算的语言理论NLP技术的应用p 机器翻译p 自动摘要p 文本分类与信息过滤p 信息检索p 信息抽取与文本挖掘p 情感分析p 自动问答p .