“切火锅”、“搞麻将撒”。在中国,有超1亿人在工作和生活中,每天讲着成都话。
近日,捷通华声灵云AI研发团队推出四川话语音识别技术,语音识别正确率实现行业领先。捷通华声成都分公司负责人表示,灵云四川话语音识别技术将服务于车载、家居智能语音交互,司法审讯、政企会议智能语音转写等场景,为巴蜀地区大众的生活和工作带来便捷。
为了能更好、更精准地识别四川话,捷通华声采集了大量真实四川话录音数据,并对其进行语料标注和数据训练,为四川话定制了专用语音识别模型。
在语音识别核心算法上,捷通华声对建模单元粗粒度、模型训练方法、解码帧率进行创新优化,有效提升了语音识别引擎的执行效率和对口音、语速的适配能力,大幅提升了四川话语音识别的正确率。
四川话语音识别让大众生活更便捷
智能语音交互技术已进入我们的生活,成为更便捷的人机交互方式。伴随着此次四川话语音识别的推出,捷通华声推出了系列四川话版智能语音产品。
灵云智能语音助理四川话版,让川蜀大众可以用四川话实现对智能电视、智能家居、智能机器人、智能可穿戴设备的语音控制;
灵云车载输入法四川话版、灵云手机输入法,可以让四川地区车主、手机用户用说四川话的方式快速进行文字输入;
此外,捷通华声四川话语音识别技术即将上线灵云平台(AIcloud.com),让开发者能快速开发出支持四川话识别的智能应用。
四川话语音识别让政企司法办公更高效
在办公方面,灵云智能语音识别技术已服务于政企会议、司法审讯等场景,用机器转写代替人工实现更高效的会议记录。
在公检法司法审讯场景,应用普通话、四川话语音识别技术,灵云智会系统将在识别审讯人普通话的同时,将被讯问人说的四川话进行识别,快速生成讯问记录,加快办案效率。
同样,在政企会议场景,灵云智会系统可以分角色地将四川话进行识别,快速生成会议记录;在医疗场景,可通过定制版的四川话医疗智能语音输入法,让医生以说话的方式快速书写电子病历。
除了上面描述的16k语音识别技术,捷通华声不久还将推出电话信道的8k四川话语音识别技术,以支持callcenter用的电话智能客服、智能外呼机器人、智能语音分析等方案产品。
捷通华声作为国内最早从事智能语音技术研发的企业之一,目前,灵云语音识别技术已支持中文普通话、四川话、英语、粤语、维吾尔语、哈萨克语、藏语安多、藏语康巴、朝鲜语、蒙文、广东阳江话等多种语言,并针对金融、电信、公检法、会议、医疗等领域训练了专用ASR模型,为行业客户提供识别率更高的语音识别能力。
捷通华声将通过成都分公司,携手产业伙伴,为四川地区客户提供更优质的本地化支持,让灵云四川话语音识别技术服务更多的巴蜀大众。