1、最高语音品质数字信号处理 IC 的研发之路数字信号处理 IC“BU8332KV-M“,系知名半导体制造商罗姆 (ROHM)面向智能手机和汽车导航仪等设备上所使用的麦克风, 开发出使两个无指向性的麦克风形成敏锐的指向性(波束赋形技术 )、提高语音品质的高端 IC 产品,品质极高。本产品采用波束赋形技术形成指向性,因为将指向轴转向声源的方向,所以大大降低了环境噪音。通过噪音抑制的功能,进一步降低残留在指向轴方向的固定噪音。这个技术和仅仅使用噪音消除的技术不同,可以更加强调声源。而且,由于能够在仅仅 10mm 的窄间距上安装两个麦克风,所以能够内置于以智能手机为代表的各种小型设备上。通过最优化处理,
2、波束赋形技术可以将使用时的处理延迟时间控制在 10msec 以下,使得对于其它应用程序的影响控制在最小的限度内。通过这些措施,有助于提高各种设备的语音识别率和改善免提的通话质量。前期工序的生产基地在罗姆株式会社(日本京都市),后期工序在 ROHM Electronics Philippines, Inc.(菲律宾) 进行,从 2012 年 8 月份开始以月产 8 万个的规模投入量产。近年来,随着语音识别技术的日益发展,语音输入系统广泛应用于以汽车导航仪及智能手机为首的移动设备上,今后,也将要扩展到家电产品。另外,在全球化商业模式之下,视频通话以及电视会议的日益频繁,未来开发性能更加良好的拾音技
3、术势在必行。在这种趋势下的拾音技术,需要使声源变得更加清晰。迄今为止,指向性麦克风只能通过物理结构( 筒状结构) 形成指向性,但是,要想使指向性提高,就会出现麦克风的尺寸变大,而物理结构没有变化,不能够控制指向性等问题出现。此次,罗姆开发出的这款数字信号处理 IC,通过采用使用两个无指向性的麦克风的波束赋形技术,使特定方向的声源语音变得清晰。使用两个麦克风形成指向性的技术早已被应用,但现有技术为了提高指向性,必须拉长麦克风间距,所以不能适应小型便携式设备的搭载要求。另外,数字信号处理的延迟时间及音质劣化,也是今后继续要攻克的研究课题。而如今,罗姆采用 DiMAGIC Corporation 的
4、指向性控制技术,并且成功地使环境噪音大幅度地衰减。利用波束赋形技术形成指向性,并且通过把指向轴转向声源方向,从而衰减了声源以外的语音。在指向轴方向残留的固定噪音通过噪音抑制的功能得以降低,因而使得声源变得清晰。其结果是使得背面方向的衰减量较传统的麦克风改善 30dB 以上。因为能在仅仅 10mm 的麦克风间距实现这样的效果,所以可以搭载在小型便携设备上。另外,通过最优化处理,波束赋形技术可以将使用时的处理延迟时间控制在 10msec 以下,使得对于其它应用程序的影响控制在最小的限度内。再者,由于能够转换指向性的形态和锐度,所以可以根据用途而实现最佳的指向性。特点 1.敏锐指向性可以更加清晰地拾
5、取声源独有的信号处理技术,与以往麦克风比较,BU8332KV-M 与以往麦克风指向性特点的比较实现了敏锐的指向性,进行声音的清晰度处理。声源方向(0)对于背面方向(180)的衰减量与以往的麦克风比较大幅度改善30dB 以上。此外,还可以实现 10mm安装间距。上图为从视觉上表示指向性的图表(指向性)。圆表示从中心的方向开始,红线表示各个方向的放大。并且,将 0 方向取为声源的方向。2.大幅度提高语音识别率可以使语音不劣化,能降低环境噪音。因此,提高在环境噪音条件下的语音识别率。通过本公司的检测,在环境噪音等级55dBSPL 的环境下的语音识别使用 BU8332KV-M 时的语音识别精度未使用时
6、,噪音等级为 55dBSPL,识别率急剧下降,使用时,则即使噪音等级为 65dBSPL,也可以实现 45 %的识别率。精度从 5%提高到 90%。3.可以选择指向性模式可以将指向性模式转换为四种形态,而且能将指向性的方向反转 180,也可以调整指向性锐度。这些控制可以不改变麦克风的配置,而只是进行寄存器的设定。 无指向性:全方位的拾音。 单一指向性: 拾取正前方的语音,并且衰减后方的语音。 锐心型指向性: 比起单一的指向性来,还衰减侧方的语音。 双指向性: 比锐心型指向性更加衰减侧方的语音。4.其它的功能使用波束赋形技术功能时的处理延迟时间为 10msec 以下。搭载降低残留在轴向指向方向的固定噪音的噪音抑制功能。采样频率 16kHz。模拟输出(LINEOUT)或者数字输出(PCM 接口)。可用 3.3V 的单系统工作(内置核心电源调节器)。内置有麦克风用偏压、前置放大器的电路。双线主机接口。可以单机工作(内置 EEPROM 用 SPI 接口)。用语说明波束赋形技术是利用多个麦克风的相位差,降低目标方向以外的语音的技术。降低环境噪音,提高目标声源的清晰度。