1、1 绪论 1.1 课题的背景与意义 语音是人类进行信息交流最直接、最方便、最有效的工具,语音信号是携带语音信息的语音声波。在信息化时代,人们也期望用这种最便捷的信息交流工具和各种信息存储、处理的设备和终端进行信息交互。语音信号处理 1研究如何能更加有效地产生、传输和获取语音信息的一门学科。它涉及数字信号处理、语言学、语音学,生理学、心理学、模式识别以及人工智能等多个学科的知识,是信息技术学科中发展最为迅速的一个领域。语音信号处理内容非常广泛,它包含语音识别语音合成,此外还有语音压缩编码、语音理解、说话 人识别、语音增强等各个分支,总的来说语音信号处理包含了语音信号的数字表示方法,语音信号处理的
2、各种方法和技术以及语音处理理论和技术在各个领域中的实际应用。 语言是人类持有的功能。声音是人类常用的工具,是相互传递信息的最主要的手段。因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息, 这对于促进社会的发展具有十分重要的意义。 让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫
3、切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。作为高科技应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长远的进步。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理。工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗 卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。可见,语音的分析和研究将是一项极具市场价值和挑战性的工作。我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走入人们的日常生活当中,并不断朝更高目标而努力。
4、 语音信号的分析之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其进行研究和探讨,除了它的实用性之外,另一个重要原因是,它始终与当时信息科学中最活跃的前沿学科保持密切的联系,并且一起发展。语音信号采集与分析是以语音语言学和数字信号处理为基础 而形成的一门涉及面很广的综合性学科,与心理、生理学、计算机科学、通信与信息科学以及模式识别和人工智能等学科都有着非常密切的关系。对语音信号采集与分析的研究一直是数字信号处理技术发展的重要推动力量。因为许多处理的新方法的提出,首先是在语音信号处理中获得成功,然后再推广到其他领域。 1.2 语音处理的研究状况 语音信号的处理最早可以追溯到 1874年电
5、话的发明,电话的理论基础是尽可能不失真地传送语音波形。直到 1939年 Dudley发 明声码器,通道声码器技术取代了“波形原则”的处理方法,它的理论基础认为语音是由人 的声带振动产生的声源 (载波 )受到不断变化的声道的控制 (调制 )而产生的,这一概念就是以后迅速发展起来,并广泛应用到各种理论研究和应用实际过程中的语音参数模型的雏形,由此人们开始了语音合成和语音压缩编码的研究。上个世 纪 60年 代中期数字信号处理的方法和技术取得突破性进展,主要是快速傅立叶变换算法的成功应用。出现了第一台以数字计算机为基础的孤立词语音识别器,随后又成功研制出第一台有限连续语音识别器。 70年 代初, Fl
6、anagan出 版的重要著作语音分析合成和感知,奠定了数字语音处理的系统理论基础。与此同时,倒谱分析 技术和线性预测技术在语音处理中得到成功应用,微电子和集成电路技术取得新的进展,高性价比的微处理器芯片和性能优异的专用信号处理芯片不断问世,再次推动了语音信号处理技术的发展和应用 2。 语音识 别 以语音为研究对象,它是语音信号处理的一个重要研究领域,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言 (如人在说话时的表情、手势等行为动作可帮助对方理解 ),其最终日标是实现人与机器进行自然语言通信,让人机交互界面更加自然和容易使用。语音
7、识别是语音处理中的难 点,对它的研究开始的比较晚,但它的一些研究方法和结果可以运用到另外的研究分支中去,因此也是语音处理研究中的重点。 1952年贝尔实验室的 Davis 等人首次研制成功能识别十个英语数字的特定人孤立数字识别系统,该系统的成功研制标志着人们开始语音识别的研究工作。此后很长的时间里,语音识别的研究方法主要是用特殊的硬件获取语音信号的特征参数,再在计算机上进行模板匹配和判决,由于受当时计算机技术和信息处理理论的限制,语音识别一直未取得突破性进展。直到上个世纪 70 年代,动态时间归正技 术 (DTW)算法、线性预测分析技 术 (LPC)理论、 LPC频谱分析、隐马尔可夫模 型 (
8、HMM)3、人工神经元网络 (ANN)、矢量量化 (V-Q)等理论,并在语音识别中成功运用,开创了语音识别研究的新局面,语音识别系统的识别率得到了显著的提高。此后语音识别系统由原来的特定人小词汇量孤立词的系统发展到能进行非特定人、大词汇量、连续语音识别。 我国语音识别理论研究和应用起步较晚,但由于汉语具有音节种类较少的特点,汉语是单音节语言,汉语中音节数只 有 400个,加上音调才 1200 个 ,词是由音节组合成,便予以音节识别为基础实现大词汇的语音识别,因此,进展较快。清华 大学、中国科学院声学所和西安电子科技大学相继成功研制出无限词汇的汉语听写机。四达公司 在 90 年代初推出首批汉语听
9、写机之后,与哈尔滨工业大学合作研制出具有自然理解能力的新产品。模识 科技公司 Pattek ASR 中 文语音识别产品,它面向不同计算平台和应用,具有国际先进水准,是我国第一个拥有完全自主知识产权的语音识别技术产品。模识科技公司此次推出的产品具有识别率高、对环境噪声和不同口音适应能力强、系统占用资源少等特点, Pattek ASR 对方 言的识别率 在 95 以上。只要对现有的手机、家电、电话总机稍作改装,就可以用语 音命令上网查阅资料、控制电视、接通电话分机,国外一些著名的大公司纷纷加大对汉语语音识别研究的投入。 进入上个世 纪 90 年代,随着多媒体时代的来临,语音识别系统由实验室走向实用
10、。许多发达国家和一些公司如美国、日本、韩国以 及 IBM、 Apple、 AT T、 NTT 等著名公司都为语音识别系统的实用化开发研究投以巨资,其中语音识别软件的发展最为迅速。语音识别软件是语音识别理论和计算机技术相结合的产物。 IBM 公司于 1997 年开发 汉语ViaVoice 语 音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别 系 统 ViaVoice98,平均识别率可 达到 95 。该系统对新闻语音识别具有较高的精度,是目前具有代表性的汉语连续语音识别系统。 IBM 宣布,为增强网络浏览和语音电子邮件的功能,将推出其新一代语音识别软件。可使用户通过语音,
11、而不是使用键盘来浏览网络、切换应用程序、执行命令、口授邮件和文本文件等操作。 语音合成是最早被研究的语音处理分支,它研究的主要内容是让人们通过听觉来获取以其他形式表示的信息。最早的语音合成是用机械的方式模拟人的发声过程而产生声音。 1939 年 Dudley 发明的声码器,用电子线路产生语音的声源, 并构成滤波器模拟声道的滤波作用。现代的语音合成都是基于计算机技术的语音处理过程。 由 D.Klatt 设 计的串、并联混合,是语音合成研究中最具代表性的工作。 20 世纪 90 年代末,日本的一些研究学者提出一种少样本、不等长语音拼接合成技 术 PSOLA,该方法来源于利用短时傅立叶变换重构信号的
12、叠接相加法。当前汉语语音合成系统中,合成效果较好的都是采用波形拼接的合成技术,文本语音转换系 统 (TTS)是语音合成的一个重要应用形式。语音合成的应用领域十分广泛,如:自动报警、报时、车站机场广播、电话查询业务以及各种电子出版物的语音 朗读等。 语音压缩编码是伴随语音的数字化而产生的,它的研究和语音合成一样起 源于 1939年 Dudley 发明的 声码器,若简单地由连续语音信号抽样量化得到的数字语音信号传输和存储,就会占用太多的信道资源和存储空间。研究表明语音信号中含有大量的冗余信息,如何采用各种编码技术,在保证尽量少的失真并具有一定的可懂度和自然度的情况下,减少语音信号的冗余度,成为语音
13、压缩编码的主要内容。最早研究和使用的编码方法是不依赖语音产生模型假定,以 PCM 和 ADPCM 为 代表的波形编码技术,它的编 码数率较高,一般在 16kb/s 64kb/s,具有语音音质高、抗躁能力强的特点。 1974 年, LPC编码首次用于分组语音通信,传输数率 达到 3.5kb/s, 实现了低速的编码。一些以 LPC以及由其改进和演变的混合编码为代表的基于模型假定的编码方法,可以更大程度上减少语音信号的冗余度,使低速率传输、存储语音信息成为可能。美国 在 1980 年公 布了一 种 2.4kb/s 的 线性预测编码技术后,于 1988 年 又公布一 个 4.8kb/s 的 码激励线性
14、预测编码 ( CELP) 语音编码算法,随后欧洲也推出 了 16kb/s 的规则脉冲激励( RELP) 线性预测编码算法。这些语音编码算法具有较好 的可懂度和自然度。随着对低速率语音编码算法研究的深入和计算机网络技术的迅速发展,语音信号经过压缩后在互联网上以数据包的形式传输,就形成了 IP 电话,它 用 VOIP 技术实现的通 过 TCP/IP 网 络以不同于传统的电话网来传输语音信号。由此衍生出在网络环境下的语音识别和语音压缩编码,成为语音处理新的发展方向。 20世纪 90年 代,针对不同的应用,国际电联和一些地区标准协会制定一系列语音压缩编码标准,如 数码率为 5.3-6.4kb/s 的
15、G.723.1,以及数码率为 8kb/s 的 G.729 等 ,这些标准的制订保证了应用在通信网中的各 种语音编码具有良好的兼容性。 语音处理的研究取得很大的成绩,一些应用也取得突破性的进展,有很多有关的研究成果已实现商品化生产并投放市场,取得较好的经济效益和社会效益。一些信息科学中的新出现的理论和处理方法引入语音处理的研究中,如小波分析、分形理论以及语音信号的非线性处理方法。由于语音本身和应用环境的复杂多变,语音处理系统的性能还是有很多不尽人意的地方,用它来解决实际问题还是有很多困难,如无限词汇汉语合成中连续语流中各基音轮廓的平滑过渡问题,语音识别系统的适应性差,主要体现在对环境依赖性强,高
16、噪声环境下语音处 理的进展缓慢。 2 语音处理的基本理论 贯穿于语音分析全过程的是“短时分析技术” 4。因为语音信号从整体来看其特性及表征其本质特征的参数均是随时间而变化的,所以它是一个非平稳态过程,不能用处理平稳信号的数字信号处理技术对其进行分析处理。虽然语音信号具有时变特性,但是在一个短时间范围内 (一般认为在 10 30ms 的短时间内 ),其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。所以任何语音信号的分析和处理必须建立在“短时”的基础上。即进行“短时分析”,将语音信号分为一 段一段来分析其特征参数,其中每一段称为一“帧”,帧长一般取为 10
17、 30ms。这样,对于整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。 根据所分析出的参数的性质的不同,可将语音信号分析分为时域分析、频域分析、倒频域分析等;时域分析方法具有简单、计算量小、物理意义明确等优点,但由于语音信号最重要的感知特性反映在功率谱中,而相位变化只起着很小的作用,所以相对于时域分析来说频域分析更为重要。设计将简要介绍时域分析、频域分析。 2.1 语音信号的时域特性 信号的时域分析就是分析和提取语音信号 的时域参数。进行语音分析时,最先接触到并且也是最直观的是它的时域波形。语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这
18、种方法直接利用语音信号的时域波形。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。这种分析方法的特点是: a.表示语音信号比较直观、物理意义明确。 b.实现起来比较简单、运算且少。 c.可以得到语音的一些重要的参数。 d.只使用示波器等通用设备,使用较为简单等。 2.1.1 短时平均能量 及短时平均幅度 由于语音信号的能量随时间而变化,轻音和 浊音之间的能量差别相当显著。因此对短时能量和短时平均幅度进行分析,可以描述语音的这种特征变化情况。 设语音波形时域信号为 )1(x 、加密分帧处理后得到的第 n 帧语音信号为 )(mxn ,则)(mxn 满足下式: ( ) ( )
19、 ( ) ( )nx m w m x n m m,01mN 1 0 ( 1 )( ) mNmwm , 0 , 其 他 值 ( 2-1) 其中, .2,1 TTn ,并且 N 为帧长, T 为帧移长度。 设第 n 帧语音信号 )(mxn 的短时能量用 nE 表示,则其计算公式如下: 1 20 ()NnnmE x m (2-2) nE 是一个度量语音信号幅度值变化的函数,但它有一个缺陷,即它对高电平非常敏感 (因为它计算时用的是信号的平方 )。为此可采用另一个度量语音信号幅度值变化的函数即短时平均幅度函数 nM ,它定义为: 10 ()NnmMn x m ( 2-3) nM 也是一帧语音信号能量大
20、小的表征,它与 nE 的区别在于计算时小取样值和大取样值不会因取平方而造成较大差异,在某些应用领域也会带来一些好处。 短时能量和短时平均幅度函数的主要用途有:可以区分浊音段与清音段,因为浊音时 nE 值比清音时大的多。 可以用来区分声母与韵母的分界 ,无声与有声的分界,连字 (指字之间无间隙 )的分界等。作为一种超音段信息,用于语音识别中 5。 2.1.2 短时过零率 短时过零率是语音信号时域分析中的一种特征参数。它是指每帧内信号通过零值的次数。对有时间横轴的连续语音信号,可以观察到语音的时域波形通过横轴的情况。在离散时间语音信号情况下,如果相邻的采样具有不同的代数符号就称为发生了过零,因此可
21、以计算过零的次数。单位时间内过零的次数就称为过零率。一段长时间内的过零率称为平均过零率。因此过零率在一定程度上可以反映信号的频率信息。语音信号不是简单的正弦序列 ,所以平均过零率的表示方法就不那么确切。但由于语音信号是一种短时平稳信号,采用短时平均过零率仍然可以在一定程度上反映其频谱性质,由此可获得谱特性的一种粗略估计。 定义语音信号 )(mxn 的短时过零率 nZ 为: )()1(s g n )(s g n )()1(s g n )(s g n nwnxnxmnwmxmxZn ( 2-4) 式中, sgn 是符号函数,即: 1 , ( 0 )1 , ( 0 )sgn x xx ( 2-5)
22、)(nw 为窗函数,计算时常采用矩形窗,窗长为 N 。可以理解为:当两个相邻点符号相同时, 0)1(s g n )(s g n mxmx ,没有产生过零;当相邻两个样点符号相反时2)1(s g n )(s g n mxmx ,为过零次数的 2倍。因此在统一帧( N 点)的短时平均过零率时,求和后必须要除以 2N。这样就可以将窗函数 )(nw 表示为: 10210)( NnNnw其它( 2-6) 在矩形窗条件下,式( 2-4)可以化简为: )1(s g n )(s g n 2 1 )1( n Nnm mxmxNZn ( 2-7) 由此可以得出实现短时平均过零率的运算图,如图 2-1 所示: 一
23、阶 差 分S g n x 取 绝 对 值低 通 滤 波h ( n ) = w ( n )S g n x ( n ) X ( n )图 2-1 短时平均过零率的运算图 在实际中求过零率参数时,需要十分注意的一个问题是如果输入信号中包含有 50Hz的工频 干扰或者 A/D 变换器的工作点有偏移 (这等效于输入信号有直流偏移 ),往往会使计算的过零率参数很不准确。为了解决前一个问题, A/D 变换器前的防混叠带通滤波器的低端截频应高于 50Hz,以有效地抑制电源干扰。对于后一个问题除了可以采用低直流漂移器件外,也可以在软件上加以解决,这就是算出每一帧的直流分量并予以滤除。 对语音信号进行分析,发现发
24、浊音时,尽管声道有若干个共振峰,但由于声门波引起功率谱的高频跌落,所以其话音能量约集中在 3kHz 以下。而发清音时,多数能量出现在较高频率上。高频就意味着高的平均过零率,低频意味着 低的平均过零率,所以可以认为浊音时具有较低的过零率,而清音时具有较高的过零率。当然,这种高低仅是相对而言,并没有精确的数值关系。 利用短时平均过零率 6还可以从背景噪声中找出语音信号,可用于判断寂静无声段和有声段的起点和终点位置。在孤立词的语音识别中,必须要在一连串连续的语音信号中进行适当分割,用以确定一个一个单词的语音信号,即找出每一个单词的开始和终止位置,这在语音处理中是一个基本问题。此时,在背景噪声较小时用
25、平均能量识别较为有效,而在背景噪声较大时用平均过零率识别较为有效。但是研究表明,在以某些音为开 始或结尾时。如当弱摩擦音 (如 f 、 h 等音素 ),弱爆破音 (如 p 、 t 、 k 等音素 )为语音的开头或结尾;以鼻音 (如 n 、 m 等音素 )为语音的结尾时。只用其中一个参量来判别语音的起点和终点是有困难的,必须同时使用这两个参数。 2.2 语音信号的频域特性 语音的感知过程与人类听觉系统具有频谱分析功能是紧密相关的,因此,对语音信号进行频谱分析,是认识语音信号和处理语音信号的重要方法。 傅里叶分析是线性系统和平稳信号稳态特性的强有力手段,在许多工程和科学领域中得到了 广泛的应用。这
26、种以复指数函数为基函数的正交变换,理论上很完善,计算上很方便,概念上易于为人们理解,是语音信号频域分析中被广泛应用的一种方法。傅里叶频谱分析的基础是傅里叶变换,用傅里叶变换及其逆变换可以得到傅里叶谱、自相关函数、功率谱、倒谱等多种频谱分析方法。 短时分析应用于傅里叶变换就是短时傅里叶变换。若有语音的时间信号 )(tx ,用短区间的时间窗函数 )(th 来分割语音信号的某个短区间,进行频谱分析,把分割出某个短区间而求得的频谱,称作短时间频谱,其定义如下: dtethtxwx jw t )()(),( ( 2-8) 上式中引入了时间参数 ,这是窗函数分割语音信号 )(tx 的终了时刻。离散的短时傅
27、里叶变换定义为: )()()( mnemxex jw mjwn ( 2-9) 式中, )( mn 是一个实数窗序列,它能够在特定时间指数 n 上从输入语音信号 )(nx中显然 )( jwn eX 是个二维函数,也称为时频函数。 我们可以从两个角度来理解时频函数 )( jwn eX 的物理意义: 第一种解释是, 当 n固 定时,例如 0nn ,则 )( jwn eX 是将窗函数的中心移至 0n 处截取 )(nx ,再做傅立叶变换而得到的一个频谱函数。这个是由式 (2-8)从频率轴方向来解释的。 第二种解释是,从时问轴方向来理解:当频率固定时,例如 k ,则 )( jwn eX 可看作是信号经过一
28、个中心频率为 k 的低通滤波器后产生的输出。 这是因为 式 (2-9)中的窗序列 )(n 通常具有带通滤波器响应,而 kjnenx )( 的傅立叶变换为 )( )( kjeX ,这里的指数 kjne 对 )(nx 有调制作 用,是使其频谱产生移位,即将 )(nx 频谱中对应于频率 k 的分量平移到零频。因此,式 (2-9)可理解为如 图 2-2所 示的带通滤波作用。 冲 击 函 数W ( n )X ( e j n w )X ( n )e j n w图 2-2 从 带通滤波作用理解短时傅立叶变换 傅立叶变换在语音信号分析中得到了应用,首先是利用傅立叶频谱,检测出其峰值并做共振的估算,这种方法称作
29、峰值检测法。其次,应用 倒谱可以求出语音信号的基音周期。可见对语音信号进行必要的频域分析对了解语音信号是很有帮助的 7。 2.3 语音识别系统 语音识别系统通常由四部分组成:语音输入、语音分析、识别处理和识别输出。其中,语音输入部分包括前置放大器、控制放大器和模数转换器等器件,它将语音信号变换成数字电信号;语音分析部分则通过滤波器、芯片等将数字电信号进行频率分析或动态分析,并找出其特征,将语音信息转化为文字信息;识别处理部分则由计算机软件与硬件将文字信息按语法、逻辑及上下文关系生成可表达准确意思的句子;识别输出部分通过不同的器 件将识别结果用各种方式输出,以便执行各种任务,如语音、文字或指令等
30、。 设计所做的工作是对一些孤立词的识别,属于小词汇量孤立单词识别系统,能使系统识别一些简单的语音命令。图 2-3 是孤立词语音识别系统的基本原理,先对输入的语音信号进行端点检测,然后,提取特征量,再根据是识别还是训练,进行模式匹配或者创建参考模式库。 语 音 输 入端 点 检 测 模 式 匹 配模 式 库识 别训 练特 征 提 取预 处 理图 2-3 语音识别流程图 2.3.1 语音信号预处理 在语音信号处理中,预处理通常包 含 A/D转 换、预加重、加窗、端点检测等基本步骤 8。 ( 1) 语音信号 模 /数 (A/D)转换 语音信号是随时间和幅度而变化的一维信号,语音信号处理是对语音信号进
31、行数字处理,所以在对语音信号处理之前需要将语音信号数字化,即进行模 /数 (A/D)转换。一个完整的模数转换必须包含有采样、保持、量化和编程四个基本过程,一般在运算过程中将采样于保持简化成一步,量化和编程简化成一步。由奈奎斯特采样定理可知,采样频率要大于或者等于原始信号频率的 2倍,才能在采样的过程中保持信号的完整性。 ( 2) 语音信号的预加重 语音信号在完成 A/D转换后可以进行预加重了,由于受声道模型中声门激励 和嘴唇辐射的影响,语音信号的高频端大 约在 800Hz以上会产生衰减,斜率通 常为 6dB/倍频。为了抵消这种现象,使高频信号曲线平滑,在分析语音信号之前应对原始语音信号进行预加
32、重来滤除低频干扰,采用一个一阶滤波器,提高语音信号的高频成分。 ( 3) 语音信号加窗处理 加窗处理其实分为两个步骤:分帧与加窗。在语音信号处理中,由于信号是一种非平稳的时变信号,但可以认为语音信号在 10ms-30ms短 时段是平稳的,将语音信号划分成一个一个这样的小时段,此为分帧,每一个小时段称为一帧。为了得到语音信号中的样本信号,用时间窗函数 去乘原始信号,相应于频域就是离散信号的频谱与窗函数频谱的卷积,此为加窗。常用的时间窗函数有矩形窗、汉宁窗和海明窗,系统中采用的是海明窗。 ( 4) 语音信号端点检测 端点检测,主要用来检测语音识别中样本信号的起点和终点,因此,又被称为起止点检测。在
33、语音信号处理中,语音信号的数据量非常庞大,如果对全部语音信号都加以处理,不仅增加系统处理器的负荷,还会影响系统的识别率。为了将有用的语音信号从系统采集的原始语音信号中提取出来,则就要对采集的语音信号进行分析,将语音的信号段和噪音段从语音信号中检测区分开来,从而准确的检 测出语音段的起点与终点,去除从语音信号中无声段,极大的减少了数字信号处理器的运算量和处理时间,提高系统的性能和识别率。端点检测是语音信号预处理的核心部分,在整个语音识别过程中也处于非常关键的位置。一般来说,端点检测位在语音信号处理的最前端,其正确与否将直接影响到整个语音识别系统的性能,由于语音信号的识别算法的前期数据是参考端点检测时的结果,所以也将直接影响到识别算法的准确性,从而影响到整个系统的性能,降低系统的识别率。因此,作为语音信号识别系统的前端处理,必须确保其优化性与准确