随着AI技术的成熟,人工智能应用的触角已经深入到各个行业,得到广泛的商业化落地,包括智慧金融、智慧教育、智能驾驶、物联网等领域。其中,智能语音交互技术作为实现人机交流的重要载体,也进一步实现与各产业的深度融合。
为提升自身产品服务能力,降低语音技术使用门槛,帮助更多开发者快速搭建语音产品,今年4月,标贝科技面向企业和个人开发者推出智能语音平台--标贝开放平台,提供语音合成及语音识别服务。近日,标贝开放平台再次完成功能升级,在提升整体视觉、交互体验的基础上,新增声音复刻、声音转换两大能力,以更丰富的商业化交互能力和个性化功能,推动智能语音交互场景落地。
两大语音能力上线构建一站式平台解决方案
据了解,标贝开放平台是为开发者提供一站式语音技术方案支持,使用者不需要深入理解语音交互原理,通过简单易用的SDK和API的接入,在管理平台创建应用服务,即可灵活调用各项技术服务,进行个性化语音交互功能开发。最终实现降低产品开发成本,缩短开发周期,快速落地市场的目的。
技术赋能方面,标贝开放平台的语音合成服务搭载了标贝科技现有的全域发音人模型,提供超过100个精品特色发音人选择,充分满足智能客服、媒体新闻、有声阅读、车载互联、泛娱乐等领域语音需求。语音识别能力可以支持一句话识别、长语音识别、录音文件识别,支持中文和英文两种语言,在安静环境下通用领域中文普通话识别率达97%以上,英文识别率超过95%。
为进一步丰富平台技术能力,满足更多合作伙伴的多样化语音定制需求,标贝此次新上了声音复刻、声音转换产品服务。声音复刻是基于标贝语音合成拓展出的个性化应用,用户只需要花费5分钟录制10个小片段,即可将自己的声音复刻下来,最终的合成效果在声音相似度、自然度等指标上均达到行业领先水平;声音转换则是在保留原说话人的语气、语调、停顿的基础上,将原说话人的声音完美转换成另一个人的声音进行输出。两大语音能力均适用于故事创作、有声小说、导航播报、创意配音等个性化定制场景。
值得注意的是,除了两大语音能力上线,此次语音合成服务也进一步优化,面向用户开放站内试听音色权限,用户可以直接在线试听多个发音人音色,然后根据需要选择最终发音人。
深耕垂直领域赋能合作伙伴商业化提速
AI技术商业化应用推动了智能语音市场的迅猛发展,搭载语音助手的智能终端数量得到进一步增长。据统计,2020年我国智能语音助手市场规模达到241.1亿元,同比上年增长50.0%。市场上的智能语音产品层出不穷,应用场景也越来越多样化。
得益于多年深耕语音交互领域的技术优势,标贝科技智能语音交互方案已经成功在金融、教育、电商、媒体娱乐等多个行业落地。面对如此丰富的产品需求,标贝科技以一站式SaaS服务平台的方式对外开放AI语音技术应用,推动语音交互技术以更便捷、更普惠的形式赋能企业和个人开发者,加速语音产品的落地。
上线不到半年,标贝开放平台进行了多个版本迭代优化,用户体验不断提升。同时,通过前期的千元大礼包、万元优惠、精品音色赠送等多个扶持计划,标贝开放平台已经吸引了近万名开发者注册使用,在智能客服、有声读物、视频软件、线上金融等多个场景得到应用。
未来,标贝开放平台将在领先的技术实力与丰富的产品化经验双轮驱动下,持续优化服务能力,助力开发者以更低的成本,创造更大的商业化价值。