发布者:技术转移办公室发布时间:2025-04-14浏览次数:61
技术主题:语言合成
发明名称:跨语句条件相干的语音编辑方法、系统及终端
申请时间:2023-02-21
申请号:CN202310146999.X
摘要:本发明的跨语句条件相干的语音编辑方法、系统及终端,通过具有将语音输入信息中的音频特征和上下文语义信息作为条件输入的变分自动编码器以及解码器的语音编辑模型,根据待编辑的语音信息获得对应的编辑梅尔谱图,能够高保真地重建原始波形的未修改区域。通过使用整体推断而非部分推断,拼接导致的衔接处不连贯得以被彻底避免。此外,与现有的部分推理编辑系统相比,本发明的整体推理方法不会消耗额外的资源。