1、语音识别芯片所涉及的技术包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别分类按照使用者的限制而言,语音识别芯片可以分为特定人语音识别芯片和非特定人语音识别芯片。特定人语音识别芯片是针对指定人的语音识别,其他人的话不识别,须先把使用者的语音参考样本存入当成比对的资料库,即特定人语音识别在使用前必须要进行语音训练,一般按照机器提示训练 2 遍语音词条即可使用。非特定人语音识别是不用针对指定的人的识别技术,不分年龄、性别,只要说相同语言就可以,应用模式是在产品定型前按照确定的十几个语音交互词条,采集 200 人左右的声音样本,经过 PC 算法处理得到交互词条的语音
2、模型和特征数据库,然后烧录到芯片上。应用这种芯片的机器(智能娃娃、电子宠物、儿童电脑)就具有交互功能了。非特定人语音识别应用有的是基于音素的算法,这种模式下不需要采集很多人的声音样本就可以做交互识别,但是缺点是识别率不高,识别性能不稳定。语音识别基本原理嵌入式语音识别系统都采用了模式匹配的原理。录入的语音信号首先经过预处理,包括语音信号的采样、反混叠滤波、语音增强,接下来是特征提取,用以从语音信号波形中提取一组或几组能够描述语音信号特征的参数。特征提取之后的数据一般分为两个步骤,第一步是系统“学习“ 或“训练“ 阶段,这一阶段的任务是构建参考模式库,词表中每个词对应一个参考模式,它由这个词重复
3、发音多遍,再经特征提取和某种训练中得到。第二是“识别“或“ 测试 “阶段,按照一定的准则求取待测语音特征参数和语音信息与模式库中相应模板之间的失真测度,最匹配的就是识别结果。语音识别四大平台1、科大讯飞科大讯飞股份有限公司成立于 1999 年,是一家专业从事智能语音及语言技术、人工智能技术研究,软件及芯片产品开发,语音信息服务及电子政务系统集成的国家级骨干软件企业。2008 年,科大讯飞在深圳证券交易所挂牌上市,股票代码:002230 。11 月 23 日科大讯飞轮值总裁胡郁在发布会上引述了罗永浩在 9 月锤子发布会上的演示数据,表示科大讯飞的语音输入识别成功率也达到了 97%,即使是离线识别
4、准确率也达到了 95%。2、云知声云知声成立于 2012 年 6 月。之前 1 年,Siri 的发布再度唤醒了大家对语音识别的关注。经过四年多的积累,云知声的合作伙伴数量超过 2 万家,覆盖用户超过 1.8 亿,其中语音云平台覆盖城市超过 470 个,覆盖设备超过 9000 万台。3、百度百度则在 11 月 22 日宣布向开发者开放了情感合成、远场方案、唤醒二期和长语音方案等四项语音识别技术。百度语音开放平台自 2013 年 10 月上线以来每日在线语音识别请求已经达到了 1.4 亿次,开发者数量超过 14 万。在如此庞大的数据支撑下,百度语音在“安静条件下”的识别准确率达到了 97%。4、搜
5、狗搜狗语音团队在 11 月 21 日推出了自己的语音实时翻译技术。搜狗的这项技术主要包括两个方面,分别是语音识别和机器翻译。根据该团队的介绍,搜狗语音识别的准确率达到了 97%,支持最快 400 字每秒的听写。语音识别芯片原厂及芯片方案1、ICRoute总部:上海简介:ICRoute 专注于开拓语音识别的芯片市场,致力于研发出高性能的语音识别,语音处理芯片。为各种平台的电子产品提供 VUI(Voice User Interface)语音人机交互界面。目前提供的语音识别芯片,可以在包括蓝牙,小家电,照明开关,玩具,车载电子,遥控器等各个电子产品领域提供非特定人的语音识别/声控功能。语音识别芯片:
6、ICRoute LD3320能在单片机上使用的语音识别芯片由 LD3320 组成的语音识别系统有很广泛的应用,如语音控制的点歌系统、语音控制的手机、音控智能导航仪、音控智能家电产品等。2、凌阳、凌通(芯片原厂)总部:台湾语音识别芯片:凌阳单片机 61A带有语音识别芯片的微控制器,可以实现语音识别功能的芯片,一般小客户只能拿到特定人识别的参考代码。3、新唐科技总部:台湾语音识别芯片:ISD9160 是一款具有 Cortex-M0 内核的语音 SOC,能够实现录音放音等应用。通过软件支持,ISD9160 可以实现特定人和非特定人语音识别。其中非特定人语音识别支持九种语音,方便客户开发国际化的产品。
7、客户在开发的时候,使用新唐提供的 ASR Tool 工具,只需将所需命令写成文本模式,然后经由工具转换,就能生成用于项目文件的语音识别代码模块,简单并且容易使用。这种语音识别方案适用于语音控制系统领域,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如智能家电、智能穿戴、声控智能玩具等许多领域。4、全志总部:珠海全志 R16 助力科大讯飞智能语音科大讯飞 4+1 环形五麦克风阵列搭载全志 R16 平台搭载全志 R16 平台的科大讯飞 4+1 环形五麦克风阵列,专为机器人等可移动、能灵活转身、有全角度拾音需求的智能硬件产品而设计,远场拾音距离可达 5 米。相比以往线性麦克风
8、单维 180 度的覆盖维度,它可将覆盖度扩大到二维空间,即 360 度全平面拾音角度,而且去噪效果更好,抗环境噪音的能力更强,就算在嘈杂的环境中也能准确地识别声音。卓越的环形五麦克风远场识别技术与语音识别、语音合成、语音唤醒、声纹识别、人脸识别等交互技术相结合,让智能硬件产品拥有了更出色的人机交互能力。5、深圳市盛矽电子科技有限公司(二次开发)总部:深圳简介:盛矽电子是专业从事语音方案与技术服务的提供商,由深圳总公司和北京研发中心分公司组成。专注于语音识别、智能玩具、儿童电脑、语音芯片等领域。语音识别芯片:1)特定人语音识别录音放音语音芯片 SR150X2)非特定人 OTP 语音识别芯片 SR
9、170X独有的的软件虚拟机技术,只要硬件资源能够匹配,所有软件功能可以通过 Flash 端实现,有效降低客人MASK 风险以及库存量,多款产品可以通过同一颗芯片实现,真正实现零库存, MASK 的价格,OTP 的性能。6、深圳市捷通语音技术开发有限公司(二次开发)总部:深圳简介:深圳市捷通语音技术开发有限公司是一家专业从事语音识别、语音合成业务的科技及贸易一体化公司。公司开创了语音识别芯片应用在玩具领域的市场。公司可根据客户的需求,提供产品的解决方案; 为特定市场的产品,设计新功能新应用 ,为品牌企业实现产品创新。7、上海华镇电子科技有限公司总部:上海简介:上海华镇是专门从事语音识别、语音合成
10、、声纹识别技术的开发、研究、软件应用及提供全程技术支持和服务的高新科技企业;全面掌握核心技术,其中中文语音识别和合成技术代表了当今世界同类产品的领先水平。其技术能够应用于各种电子及通信设备,包括:智能玩具,智能家居系统,智能汽车导航及声控,智能手机 Smartphone、 PDA、固定电话、移动电话,电信级的服务器及个人电脑等。语音识别芯片/模块:1)语音识别芯片/模块 GM11A5502)高端语音识别芯片/模块 WS117-最多支持 1000 条词条识别此芯片已停产3)特定人语音识别(SD)芯片 WS-1008、北京承芯卓越科技有限公司总部:北京简介:公司成立于 2006 年 12 月,是一
11、家立足于中关村清华科技园区的北京市高新技术企业,海淀区创新企业,是以提供具有自主知识产权的智能语音处理类专用芯片和方案为主业的高科技公司。主要致力于自主研发嵌入式语音识别芯片、应用软件技术、和智能语音应用方案。语音识别芯片:1)语音识别芯片-28X2)语音识别芯片-29X3)语音识别协处理芯片-HBR34X9、深圳唯创知音电子有限公司总部:深圳简介:专注于语音技术研究、语音产品方案设计及控制等软、硬件设计的高新技术公司。杰出的语音芯片厂家,从事语音芯片研究及外围电路开发;同时为有特别需求的客户制订语音产品开发方案,并且落实执行该方案,完成产品的研发、测试,声音处理,直至产品的实际应用指导等一系
12、列服务。业务范围涉及电话录音、汽车电子、多媒体、家居防盗、通信、家电、医疗器械、工业自动化控制、玩具及互动消费类产品等领。语音识别芯片/模块:WTK6900B01 语音识别模块语音识别的应用前景智能语音车载曾经看过一款汽车的概念宣传广告,驾驶员通过语音指令找到自己的车;打开车锁,通过语音指令寻找导航,播放音乐等等,相当炫酷。当然对于智能车载来说更关键的是行车安全问题,对于驾驶员来说,能通过语音控制接打电话,查看自己的社交软件,绝对比在开车的过程中手忙脚乱的用手控制来的更安全。智能语音家居现在的智能家居市场之所以外热内冷,智能家居产品之所以不受消费者待见,一个非常主要的原因是现在的智能家居产品没
13、有抓住消费者的痛点,将原本简单的事情复杂化了。在手机上找到控制 app 打开窗帘的过程远比消费者直接走到窗前拉开窗帘来的麻烦。而有了语音识别的智能家居则不一样,消费者只要轻轻说声“开窗帘”就能打开窗帘。智能语音医疗应用前一段时间,著名语音识别企业 Nuance 在其官方博客上,公布了将发力医疗领域的消息。其产品不但能通过智能手表追踪人体运动情况和心率,还可以根据人的身体状况匹配相应的服务,如合适的餐厅或食物等。另外他们还考虑到更多场景,诸如紧急语音求助,医患对话存档,呼叫中心的对话听写等。智能穿戴语音控制我们总有那么些时间是没法使用自己的双手的。打电话,发微信,查路线,叫车,这些如果都可以用一个可穿戴设备通过语音控制实现,那该多好!总结:除了以上列举的,语音识别还有更多更广的应用。随着我们的生活越来越智能化,相信语音识别的应用场景肯定是非常广阔的。