1、浅议自然语言信息处理的智能化应用论文关键词:自然语言处理 语言翻译 人工智能 论文摘要:自然语言信息处理是人机交互的关键技术,已得到高速的发展。论文首先简单的论述了该技术的起源以及发展,然后重点研究了该技术在文本和语音方面的广泛应用。可以预测随着计算机技术的进一步发展,自然语言信息处理技术将被应用到更加广泛的领域。 一、引言 近年来随着计算机技术和人工智能的快速发展,自然语言信息处理技术已取得了长足的发展。于此同时人们在快速信息检索、语言翻译、语音控制等方面的需求越来越迫切。如何将自然语言处理中取得的研究成果应用于文本、语音等方面已成为目前应用研究的一个关键。论文将从自然语言信息处理的基础出发
2、,系统的论述它在语音和文本方面的广泛应用。 二、自然语言信息处理技术简介 自然语言信息处理技术产生于上个世纪 40 年代末期,它是通过采用计算机技术来对自然语言进行加工处理的一项技术。该技术主要是为了方便人与计算机之间的交流而产生的。由于计算机严密规范的逻辑特性与自然语言的灵活多变使得自然语言处理技术较复杂。通过多年的发展,该项技术已取得了巨大的进步。其处理过程可归纳为:语言形式化描述、处理算法设计、处理算法实现和评估。其中,语言形式化描述就是通过对自然语言自身规律进行研究,进而采用数学的方法将其描述出来,以便于计算机处理,也可认为是对自然语言进行数学建模。处理的算法设计就是将数学形式化描述的
3、语言变换为计算机可操作、控制的对象。处理算法实现和评估就是通过程序设计语言(如 C 语言)将算法实现出来,并对其性能和功能进行评估。它主要涉及到计算机技术、数学(主要是建模) 、统计学、语言学等多个方面。 三、智能应用 通过多年的研究,自然语言信息处理技术已经取得了巨大的进步,特别是在应用方面。它主要被应用于文本和语音两个方面。 (一)自然语言信息处理在文本方面的智能应用 在文本方面,自然语言处理技术主要应用在语言翻译、字符识别、文本信息过滤、信息检索与重组等方面。其中,语言自动翻译是一个十分重要并具有极大现实意义的项目。它涉及到计算机技术、数学建模技术、心理学以及语言学等多个方面的学科。通过
4、近些年的努力已得到了一定的发展。自然语言处理技术已在多个方面提升了翻译的效率和准确性。如自然语言处理中的语言形态分析与歧义分析对翻译技术来说十分重要,可以很好的处理翻译中的多意现象和歧义问题,从而提高翻译的准确性。字符识别具有广泛的商业应用前景,它是模式识别的一个分支。字符识别的主要过程可分为预处理、识别以及后期处理。目前,字符识别已得到了广泛的应用,并且效果良好,但还存在识别不准确的问题,其主要问题就出在合理性上,其中后期处理就涉及到采用词义或语料库等对识别结果进行合理性验证,通过该技术就能很好的解决识别不准确的问题,当出现识别不准确、出现多个识别结果时可以通过合理性验证技术高效的过滤掉异常
5、选项,从而实现快速、准确的识别。目前自然语言信息处理技术在文本方面应用最广的就是文本检索。通过采用自然语言信息处理技术,一方面能快速分析用户输入信息并进行准确理解为检索提供更加准确的关键词,并且可以扩展检索输入的范围,让其不仅仅局限在文本输入方面,如采用语音输入或基于图像的输入;另一方面,通过采用自然语言信息处理技术可以对搜索到的信息进行处理让用户获取的是更加有效、准确的信息而不是海量的信息源(如许多网页) 。因为将自然语言处理技术与文本重组技术相结合就可以极大的提高检索的效果,缩小答案的范围,提高准确性。当然,还可以提高检索的效率。目前,在中文全文检索中已得到了广泛的应用,并且效果良好。 如
6、果能进一步的研究自然语言信息处理技术,将能实现信息的自动获取与重组,这样将能实现自动摘要生成、智能文本生成、文件自动分类与自动整理。若能进一步结合人工智能技术,将能实现文学规律探索、自动程序设计、智能决策等诸多方面的应用。这样可以减轻人类的工作强度,让我们从繁琐的基础工作中走出来,拥有更多思考的时间,从而能更加有效的推动技术的进步。 (二)自然语言信息处理在语音方面的智能应用 在语音方面,自然语言处理技术主要应用在自动同声传译、机器人聊天系统、语音挖掘与多媒体挖掘以及特定人群智能辅助系统等方面。其中,自动同声传译主要涉及到语音建模、识别以及语言翻译等方面,采用自然语言处理技术可以对自动同声传译
7、的每个方面都能得到提高,最直接的部分就是语言翻译部分,同时还可能涉及到语音与文本的转换。特别是在语音和文本的转换方面,目前在中文出来中出现的一个问题是音似问题,即音似字不同的情况,对这种情况如果能采用自然语言处理技术来对其进行校验,将能提高其转换的效果,从而提高转换的质量和准确性。机器人聊天系统涉及到更加广泛的内容,如自动回答系统。在机器人聊天系统中不可避免的涉及到语音与文本的转换、自动回答以及逻辑推理,通过自然语言处理技术将能在意义理解、逻辑推理和知识应用等方面得到明显提高,从而使得应答的速度和回复的针对性和准确性等方面都得到一定的提高,从而提高聊天系统的应用性。在语音挖掘与多媒体挖掘方面,
8、自然语言处理技术的应用主要体现在增强意义理解和提高检索速度这两个方面。通过该技术一方面能根据准确的获取语音所包含的意义,从而为搜集信息提供基础。同时,由于采用该技术也有助于数据挖掘中的对相关信息的检索和归纳。 随着人工智能、计算机视觉等技术的快速发展、自然语言处理技术将能应用于诸如自动场景解说系统等。也就是自然语言处理技术再结合图像理解技术和逻辑推理技术,就能准确的描述当前场景发生了什么事情,如果能和上一个场景进行比较就能及时的描述场景的变化,并通过有效的组织就能实现对场景的自动描述。再进一步利用人工智能技术、知识库及语音生成技术就能实现场景的自动解说,甚至能实现如自动足球运动这样快速场景变换
9、的解说。同时,还能对特定人群提供辅助,如为盲人提供辅助的系统,帮助盲人识别物体以及其他的一些帮助。也可以应用于语音控制,语音控制目前也具有广泛的需求,可以应用在很多方面,将自然语言处理技术、语音建模技术、计算机技术以及控制技术相结合就能实现语音控制,甚至能应用于工厂的智能控制和管理。 四、结论 近年来自然语言处理获得了巨大的发展,其关键技术也获得了突破。该技术所开发的新技术能对文本处理与语音业务处理产生广泛而深远的影响。目前,可以肯定的是自然语言处理技术能对文本处理与语音处理在建模、识别、理解方面将产生极大的作用,甚至可以预测随着该技术的进一步发展,将对多媒体技术及应用起到重大的作用。如果经过进一步的开发,该技术将能对目前控制方式产生较大的影响。 参考文献: 1王丁,李向宏,王鑫.机器翻译转换生成研究J.信息技术,2002,6:68-70 2周会平,王挺,陈火旺.汉英翻译系统 IcENT 的中间语言设计J.计算机研究与发展,2000,37,3:336-343 3侯志霞,曹军.自然语言处理的发展概况及前景展望J.山东外语教学,2003,5:53-55