随着深度神经网络算法的应用,语音合成技术日趋成熟,并已融入生活的方方面面。捷通华声专注智能语音研究十余年,在不断坚持开发与提升语音识别核心技术实力的同时,发展出来了成熟完整的产品体系,让语音识别技术能够真正为人们的生活带来便利,提升工作的效率,甚至突破语言的障碍,打造跨语种交流平台。
核心技术过硬,特点突出
普通话识别率高达98%;
识别1s的语音耗时小于0.25s;
中文、英文、数字混合识别;
自动打标点;
情绪检测;
自动区分说话人;
实时、离线多种识别模式;
支持本地化语言模型训练;
支持普通话、英语、粤语、闽南语、上海话、四川话、维吾尔语、哈萨克语、藏语、朝鲜语、蒙语、彝语、壮语等语种或方言。
灵活应用能力,形成完整产品体系
A 智能语音输入 完成信息高效录入
企事业单位可以应用语音识别技术,识别日常工作会议发言,快速生成会议记录;
地区公安、检察、法院等政法机构可以应用语音识别来转写办案过程中的问讯发言,快速生成办案笔录;
医院可以引进语音识别技术,让医生可以用口述的方式快速完成电子病历的语音录入,把更多时间和精力留给病人。
B 实现客服中心的智能化升级
借助语音识别技术,客服中心的业务咨询办理、质检、外呼以及语音导航系统均可实现智能化升级。通过将海量的通话录音转写为文字,实现语音数据的结构化,企业可以应用这些服务数据,进行业务建模,分析挖掘客户诉求,预测业务发展趋势,优化业务服务,以及发现潜在业务风险点。
C 智能语音输入法/智能语音助手 改变日常生活
在生活方面,语音识别技术已成熟应用于语音输入、语音交互等场景。
灵云车载输入法和灵云手机输入法,提供语音输入方式,用户只需直接说出内容,即可准确识别成文字,让文字输入更加简便、安全。
另外,语音识别技术让用户可对各类家居、家电语音助手,以及智能机器人、智能可穿戴设备等进行语音控制,简单方便,营造舒适随心的生活环境。
D 灵云开放平台 提供免费语音识别能力 赋能百业,共享AI未来
个人开发者可以登陆aicloud.com,将语音识别能力嵌入到各类应用中。灵云平台上的语音识别技术已服务包括打车软件、输入法、翻译APP、手机银行客户端等各类数十万应用,覆盖数亿终端用户。
E 灵云语音云 实现语音离线转写需求
用户可登陆speech.aicloud.com,上传语音文件,实现语音转写。
目前平台支持mp3、wav、m4a、spx、opus、amr音频格式,并提供聊天领域、电话客服热线、教育学习成长、金融财经投资、政府党政会议、恋爱心理情绪等专业领域的语音转写服务。转写速度快,1小时的录音几分钟即可转写完成。
从说到听,灵云实现跨语种交流
捷通华声打造的“维汉友谊桥”,将捷通华声自主研发的语音识别、语音合成、机器翻译能力融为一体,提供高效准确的维汉互译服务。
维族同胞能够直接通过说话的方式进行文字录入,而翻译的结果可以用语音合成播报出来,实现从“说维语”到“听维语“的完整闭环,不懂民族文也不影响app的使用。如此,维族同胞可以用语音互译软件与汉族民众进行语音沟通,极大地便捷了民族间的文化、商务交流。