• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    语音控制开发之旅,能不能“说走就走”?
      三年前的2016年,互联网女皇玛丽•米克尔在其年度《互联网趋势》报告中曾经预测,人机交互即将迎来新一轮的变革,而语音将成为人机交互的新范式。从那以后,本来已经蠢蠢欲动的智能语音市场就真的应声“火”了起来。
      这把“火”究竟有多旺,我们可以从三个方面直观地感受出来:其一,就是众多互联网巨头在语音处理领域的积极投入;其二,是2017年之后以亚马逊Echo为代表的智能音箱单品的火爆;其三,是类似Siri的语音助手功能在智能手机中渗透率越来越高。种种迹象都在告诉我们,智能语音相关的生态链正在逐渐成熟,基于智能语音的相关应用迟早有一天会成为众多智能产品的标配,比如说在智能家居等应用中的语音控制功能。
      当然,想做率先“吃螃蟹”的人,也就必然会面临着一系列需要跨越的“坑”。具体到智能语音控制领域,这样的“坑”主要来自三个方面:
      首先是成本。因为成本是任何一种技术大规模普及的重要前提,特别是当我们考虑到要将语音控制功能集成到不同的嵌入式设备中去,真正做到让语音“无处不在”的时候,成本的压力会更为突出。
      其次是缺乏整体解决方案。毕竟,对于新技术来说,完整成熟的参考设计方案会比较“罕见”。如果有,对于开发者来说将是真福利。
      再有就是如何顺利接入语音处理引擎。众所周知,智能语音控制应用背后都会与一个云端的语音处理引擎相连,如亚马逊的Alexa、科大讯飞开发语音平台等,这其中有不少繁复的测试认证过程。
      上面这三个制约因素也决定了语音控制方案开发之旅并不是一场“说走就走”的旅行,在此之前开发者免不了要做大量准备工作。
      不过现在,情况不一样了,因为下面这个由恩智浦开发的方案(见图1),打破了以往的制约。在这个面积为30mmx40mm超小型电路板中,几乎覆盖了嵌入式语音识别所有的性能和功能需求,让困惑开发者的难题迎刃而解。
    图1.基于恩智浦i.MX RT跨界处理器的语音控制方案(图片来源:NXP)
      基于MCU的设计
      这个方案最鲜明的一个特点就是,其主控芯片采用的不是微处理器,而是一颗‘MCU’——恩智浦的i.MX RT跨界处理器。之所以称为“跨界”,是因为一方面i.MX RT采用了主频高达600MHz的Arm Cortex-M7内核,性能甚至比普通的Cortex-A5都高一倍;而另一方面,其在成本和功耗方面又能够与MCU看齐,而且继承了MCU的开发工具链,使得以前熟悉MCU的开发者都能够很快上手。正是因为这种“鱼和熊掌”兼得的特性,i.MX RT一经推出就受到了开发者的青睐。
      此番将i.MX RT引入到语音控制领域,根据恩智浦的估算,与以往基于微处理器的解决方案相比可以将总系统成本减少一半以上。这也使得这个基于MCU的语音控制方案极具竞争力。
    图2.i.MX RT106A跨界处理器系统框图(图片来源:NXP)
      整体解决方案
      该方案中使用的跨界处理器的型号是i.MX RT106A,它是通用的i.MX RT1060产品中的一个特殊型号,专门针对基于云端的嵌入式语音应用进行了优化,特别是可授权使用恩智浦完整的语音助手软件解决方案,包括低延迟,远场“唤醒字”检测、噪声抑制、回声消除和语音打断功能等一系列特性。这显然会令开发事半功倍,也让整个系统的BOM更为简化。
      除了核心的主控芯片,整个基于i.MX RT的语音控制解决方案中还包括其他一些关键元器件,如TFA9894D智能音频放大器和可选的A71CH安全元件,以及一个完整的参考BOM,可为客户提供了一个从硬件到软件的完整的交钥匙解决方案。
    图3.i.MX RT语音控制方案硬件框图(图片来源:NXP)
      与Alexa连接
      特别值得一提的是,该方案还可无缝连接Amazon Alexa语音服务(AVS)平台,与AVS认证软件、安全性和入门使用完全整合,大幅减少了植入Alexa所需的工程投资,缩短语音控制产品的上市时间。为此,恩智浦还在美国设置了实验室,专门为内置Alexa的产品提供测试服务,帮助客户通过亚马逊的最终评估。
      实际上这种增值服务模式,也是亚马逊等语音处理平台提供商所乐见的,因为这有利于其平台形成一个更完善的应用生态系统,是一个双赢的结果。所以我们也可以想见未来类似的服务会被复制到与其他智能语音处理平台的合作中。
    图4.i.MX RT语音控制方案与AVS整合框图(图片来源:安富利)
      总之,这个基于MCU的语音控制解决方案为开发者提供了一种“即插即用”式的开发体验,无论是从硬件、软件,还是与语音处理平台功能的整合,都能快速搞掂。如果你想在自己的嵌入式产品中加入智能语音处理功能,现在可以“说走咱就走”了。
    上一篇:不同的网站类型需要选择不同CMS
    下一篇:草根站长前期赚钱很难
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    语音控制开发之旅,能不能“说走就走”? 语音,控制,开发,之旅,能不能,