1作为人工智能分支的自然语言处理:停滞的技术 2起源 以人工智能的知识工程的角度来看待分析当前的自然语言处理技术。 当前的自然语言处理被机器学习为代表的自动化数据挖掘技术所严重渗透。 可将其归结为一种知识获得和学习分离的智能系统处理方法。 忽略了基本的机器学习原则而导致低效的知识处理 两个关联但是有区别的困境 单一的数据挖掘方式的自然语言处理未能从根本上改变知识表示和知识获取的人工智能困难。 以监督学习为代表的统计机器学习方法并不能带来真正的实用化的推广性能增长。 我们的建议。3内容 自然语言处理中的机器学习技术的兴起 被忽略的准则 没有免费的午餐 丑小鸭 Zipf 律 困境的实例 学习性能增长根本来源是语料增长 指数增长的语料带来线形的性能提升 结语4机器学习的兴起现代方法 最大熵用于词性标注 AdwaitRatnaparkhi,JeffreyC.Reynar,SalimRoukos.AMaximumEntropyModelforPrepositionalPhraseAttachment.HLT1994 机器翻译 FranzJosefOch,HermannNey.Discrimina