首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

基于神经网络的统计参数语音合成方法研究

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第17-24页
    1.1 语音合成的研究意义第17-18页
    1.2 语音合成方法概述第18-21页
        1.2.1 语音信号的产生模型第18页
        1.2.2 语音合成历史简介第18-20页
        1.2.3 统计参数语音合成方法第20-21页
    1.3 研究内容概述及论文结构安排第21-24页
        1.3.1 现有方法存在的不足第21-22页
        1.3.2 本论文的研究内容第22-23页
        1.3.3 论文结构安排第23-24页
第2章 统计参数语音合成方法回顾第24-37页
    2.1 统计参数语音合成框架第24-26页
    2.2 基于HMM的统计参数语音合成第26-30页
        2.2.1 隐马尔科夫模型第26-27页
        2.2.2 HMM语音合成声学建模方法第27-28页
        2.2.3 关键技术第28-29页
        2.2.4 总结和改进第29-30页
    2.3 基于神经网络的声学建模方法第30-36页
        2.3.1 神经网络模型简介第30-31页
        2.3.2 全连接神经网络第31-33页
        2.3.3 递归神经网络第33-35页
        2.3.4 基于DNN和RNN的声学建模方法第35-36页
    2.4 本章小结第36-37页
第3章 基于深度信念网络的频谱表征方法研究第37-53页
    3.1 受限玻尔兹曼机第37-43页
        3.1.1 背景介绍第37-39页
        3.1.2 模型结构第39-41页
        3.1.3 模型训练第41-43页
    3.2 深度信念网络第43-45页
        3.2.1 模型结构第43-44页
        3.2.2 模型训练第44-45页
    3.3 基于DBN的频谱表征第45-48页
        3.3.1 DBC特征提取与频谱重构方法第45-46页
        3.3.2 基于DBC特征的HMM语音合成第46-48页
    3.4 实验结果和分析第48-51页
        3.4.1 实验配置第48页
        3.4.2 实验结果第48-51页
    3.5 本章小结第51-53页
第4章 基于卷积神经网络的频谱表征方法研究第53-66页
    4.1 卷积神经网络第53-57页
        4.1.1 卷积和反卷积第53-54页
        4.1.2 池化第54-55页
        4.1.3 卷积神经网络第55-57页
    4.2 SWWAE第57-59页
        4.2.1 模型结构第57-58页
        4.2.2 模型训练第58-59页
    4.3 基于SWWAE的频谱表征第59-61页
        4.3.1 特征提取第59-60页
        4.3.2 声学建模第60-61页
    4.4 实验结果和分析第61-64页
        4.4.1 实验配置第61-62页
        4.4.2 实验结果第62-64页
    4.5 本章小结第64-66页
第5章 基于二值隐层深度自编码器的频谱表征方法研究第66-88页
    5.1 深度自编码器第66-69页
        5.1.1 自编码器第66-67页
        5.1.2 深度自编码器第67-68页
        5.1.3 模型训练第68-69页
    5.2 基于DBN和DAE的语音合成频谱表征的相关工作与问题分析第69-70页
    5.3 二值隐层深度自编码器第70-76页
        5.3.1 隐层节点二值化程度对深度自编码器影响的理论分析第71-74页
        5.3.2 二值隐层深度自编码器训练方法第74-76页
    5.4 实验结果和分析第76-87页
        5.4.1 实验配置第76-78页
        5.4.2 BDAE的模型加噪训练验证第78页
        5.4.3 BDAE对缓解过平滑效应的作用分析第78-80页
        5.4.4 BDAE训练过程中高斯方差的调节第80-82页
        5.4.5 BDAE预训练方法的比较第82-85页
        5.4.6 基于DBN、DAE、BDAE以及SWWAE的频谱表征方法对比第85-87页
    5.5 本章小结第87-88页
第6章 基于生成对抗网络的统计参数语音合成方法第88-106页
    6.1 生成对抗网络第88-96页
        6.1.1 模型框架第88-90页
        6.1.2 模型分析第90-92页
        6.1.3 GAN改进模型第92-96页
    6.2 基于GAN的语音合成相关研究第96-97页
    6.3 基于生成对抗网络的语音合成声学建模方法第97-100页
        6.3.1 对现有方法的分析第97-98页
        6.3.2 本文提出的方法第98-100页
    6.4 实验结果和分析第100-104页
        6.4.1 Blizzard Challenge 2017简介第100页
        6.4.2 系统配置第100-101页
        6.4.3 实验分析第101-103页
        6.4.4 实验结果第103-104页
    6.5 本章小结第104-106页
第7章 总结第106-108页
    7.1 主要贡献与创新点第106-107页
    7.2 后续研究方向第107-108页
参考文献第108-115页
致谢第115-116页
在读期间发表的学术论文与取得的研究成果第116-117页

论文共117页,点击 下载论文
上一篇:机载图像拼接关键技术研究
下一篇:高分辨率遥感成像仿真关键技术研究