• EN
  • 登录Egate

导航

  • 最新动态
  • 技术推荐
  • 创业教育
  • 创业生态
    • 双创平台
    • 早期融资
    • 孵化公司
    • 孵化空间
    • 合作伙伴
  • 制度政策
    • 国内制度
    • 校内制度

基于变分自动编码器的跨语句语音合成方法、系统及设备

发布者:技术转移办公室发布时间:2025-04-14浏览次数:67

技术主题:语言合成

发明名称:基于变分自动编码器的跨语句语音合成方法、系统及设备

申请时间:2022-03-08

申请号:CN202210220764.6

摘要:本发明提供一种基于变分自动编码器的跨语句语音合成方法、系统及设备,通过将跨语句信息与用以增强韵律的变分自动编码器有机结合,提出了基于变分自动编码器的跨语句语音合成系统,通过条件化声学特征、说话人信息和当前及周围语句中获得的文本特征,来估计每个音素潜在韵律特征的后验概率分布;该系统包括跨语句表征模块和韵律增强模块,通过使用多头注意力层生成音素级别的跨语句表征,并将跨语句表征模块的输出作为韵律增强模块的特定语句的先验条件,以改进标准变分自动编码器。本申请不仅提升了合成语音的自然度,改善了合成语音的韵律变化,同时解决了推理时系统所采样的标准高斯先验和语音的真实先验之间不一致的问题。

技术转移办公室简介

跨界引领创新创业生态,营造创新创业氛围,运营自主知识产权,孵

化早期技术和初创企业,促进创新创业的实践教育,扩大创新创业对

产业和经济的影响力,践行学校使命,做出时代贡献。


ABOUT US:

The office aims to lead cross-border innovation and entrepreneurship practice and build a creative atmosphere on campus. By operating independent IPRs, incubating early-stage technologies and startups, and promoting innovation and entrepreneurship education, we hope to expand the impact of innovation and entrepreneurship on enterprises, fulfill the mission of ShanghaiTech and contribute to society.

联系方式:                         

地址:上海市浦东新区华夏中路393号

邮箱:ott@shanghaitech.edu.cn 



  • 关注我们

    扫一扫

Copyright © 上海科技大学 版权所有沪ICP备13001436号-1沪公网安备 31011502006855号