• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    标贝科技语音库|模仿童声、中文女声情感数据库 --分为喜、怒、哀、惊、惧、厌六种情感的表达
      语音合成技术的推广应用,对语音合成的质量提出了更高的要求。如何进一步提高语音合成的表现力,特别是让合成语音能够模拟表达说话人的情感状态,是语音合成未来发展的趋势,也是语音合成研究领域所面临的一个难题。而情感语音库是语音合成技术的基础,也是决定语音合成效果的关键因素。
    Your browser does not support the audio element.
    (点击试听情感效果)
      模仿童声—情感音库
      【模仿童声DB-6-情感音库】采集对象为标准普通话女声模仿儿童,听感活泼甜美。分为喜、怒、哀、惊、惧、厌六种情感的表达。录制环境为专业录音室和录音软件,录音环境和设备自始至终保持不变,录音环境的信噪比不低于35dB;单声道录音,用48KHz16比特采样频率、PCMWAV格式。录音语料为中文,利于各情感的表达,并对音节、音子、韵律等在有限语料基础上做了尽可能全面的覆盖。根据合成语音标注标准,依据发音人实际发音对音库进行文本音字校对、韵律层级标注。
    Your browser does not support the audio element.
      (点击试听情感效果)
      数据应用场景
      本语音数据库应用广泛,可用于以下方面:
      1.科研,可用于语音合成系统模型训练;
      2.有声读物;
      3.生活出行;
      3.智能科技;
      4.教育、娱乐等。
      技术参数

    数据规格

    数据内容

    中文女声DB-6情感音库数据

    录音语料

    6种情感各2000句语料(喜、怒、哀、惊、惧、厌)

    有效时长

    14成品小时(12000句)

    平均字数

    15/

    语言类型

    标准普通话

    发音人

    女;20-30岁;声音温柔亲切

    录音环境

    声音采集环境为专业录音棚环境

    1)        录音棚符合专业音库录制标准;

    2)        录音环境和设备自始至终保持不变;

    3)        录音环境的信噪比不低于35dB

    录制工具

    专业录音设备及录音软件

    采样格式

    无压缩PCM WAV格式,采样率为48KHz16bit

    标注内容

    中文音字标注、韵律标注、声韵母边界标注

    标注格式

    文本标注为.txt格式文档;边界标注为.interval格式文档

    质量标准

    1. 语音文件为48k 16bit wav格式,音色、音量、语速一致,无截幅;

    2.标注文件字准率不低于99.8%

    3.韵律无明显不合理标注错误;

    4.音素边界错误大于10ms的比例小于1%;音节边界准确率大于98%.

    存储方式

    本地FTP存储

    文件格式

    音频文件:WAV 文本标注文件:TXT 边界标注文件:INTERVAL

    数据脱敏

    数据敏感项

    产品应用

    适用领域

    科研、智能科技、生活、教育、娱乐等多领域应用

    版权归属

    版权所有者

    标贝(北京)科技有限公司

      中文女声—情感音库
      【中文女声DB-6情感音库】采集对象为标准普通话女声,分为喜、怒、哀、惊、惧、厌六种情感的表达。录制环境为专业录音室和录音软件,录音环境和设备自始至终保持不变,录音环境的信噪比不低于35dB;单声道录音,用48KHz16比特采样频率、PCMWAV格式。录音语料为中文,利于各情感的表达,并对音节、音子、韵律等在有限语料基础上做了尽可能全面的覆盖。根据合成语音标注标准,依据发音人实际发音对音库进行文本音字校对、韵律层级标注、声韵母边界标注。
    Your browser does not support the audio element.
    (点击试听情感效果)
      数据应用场景
      本语音数据库应用广泛,可用于以下方面:
      1.科研,可用于语音合成系统模型训练;
      2.有声读物;
      3.生活出行;
      3.智能科技;
      4.教育、娱乐等。
      技术参数

    数据规格

    数据内容

    模仿童声DB-6情感音库数据

    录音语料

    6种情感各2000句语料

    有效时长

    14成品小时(12000句)

    平均字数

    15/

    语言类型

    标准普通话

    发音人

    女声模仿儿童,活泼甜美风格

    录音环境

    声音采集环境为专业录音棚环境

    1)        录音棚符合专业音库录制标准;

    2)        录音环境和设备自始至终保持不变;

    3)        录音环境的信噪比不低于35dB

    录制工具

    专业录音设备及录音软件

    采样格式

    无压缩PCM WAV格式,采样率为48KHz16bit

    标注内容

    中文音字标注、韵律标注

    标注格式

    文本标注为.txt格式文档

    质量标准

    1.语音文件为48k 16bit wav格式,音色、音量、语速一致,无截幅;

    2.标注文件字准率不低于99.8%

    3.韵律无明显不合理标注错误。

    存储方式

    本地FTP存储

    文件格式

    音频文件:WAV 文本标注文件:TXT

    数据脱敏

    数据敏感项

    产品应用

    适用领域

    科研、智能科技、生活、教育、娱乐等多领域应用

    版权归属

    版权所有者

    标贝(北京)科技有限公司

     

    上一篇:谷歌移动搜索:用户体验度低的站点要惨了?
    下一篇:推荐给程序员的6款bootstrap模板
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    标贝科技语音库|模仿童声、中文女声情感数据库 --分为喜、怒、哀、惊、惧、厌六种情感的表达 标贝,科技,语音,库,模仿,