采用超音段韵律特征联合短时频谱的语音转换
| 摘要 | 第1-5页 |
| Abstract | 第5-10页 |
| 第一章 绪论 | 第10-16页 |
| ·语音转换的定义 | 第10页 |
| ·语音转换研究的意义和应用前景 | 第10-12页 |
| ·国内外的研究现状及存在的问题 | 第12-14页 |
| ·课题的研究目标及论文的组织结构 | 第14-16页 |
| 第二章 语音转换的相关问题 | 第16-28页 |
| ·语音信号的基础知识 | 第16-19页 |
| ·语音的产生机理 | 第16-18页 |
| ·语音产生的数学模型 | 第18-19页 |
| ·语音信号的说话人特征 | 第19页 |
| ·语音信号的分析 | 第19-23页 |
| ·分帧 | 第20页 |
| ·预加重 | 第20-21页 |
| ·加窗 | 第21-22页 |
| ·短时能量和短时平均幅度 | 第22页 |
| ·短时自相关函数 | 第22-23页 |
| ·语音转换的原理 | 第23-24页 |
| ·STRAIGHT合成语音的算法 | 第24-25页 |
| ·语音转换性能的评价标准 | 第25-27页 |
| ·客观评价标准 | 第25-26页 |
| ·主观评价标准 | 第26-27页 |
| ·本章小结 | 第27-28页 |
| 第三章 频谱包络的转换 | 第28-39页 |
| ·概述 | 第28页 |
| ·频谱包络转换主要的方法 | 第28-32页 |
| ·矢量量化法 | 第28-29页 |
| ·说话人插值法 | 第29-30页 |
| ·人工神经网络法 | 第30-31页 |
| ·隐马尔可夫模型法 | 第31-32页 |
| ·本文采用的基于高斯混合模型的频谱包络转换 | 第32-38页 |
| ·语音信号的时间对齐 | 第32-34页 |
| ·GMM模型 | 第34-35页 |
| ·转换函数 | 第35-36页 |
| ·谱包络转换 | 第36-38页 |
| ·本章小结 | 第38-39页 |
| 第四章 韵律特征的转换 | 第39-54页 |
| ·概述 | 第39页 |
| ·基音频率的转换 | 第39-46页 |
| ·传统的转换方法 | 第39-42页 |
| ·传统转换方法的优缺点 | 第42-43页 |
| ·基频目标模型的引入与建模 | 第43-45页 |
| ·基音频率转换的实现 | 第45-46页 |
| ·基于统计模型的语速、停顿、重音变换 | 第46-52页 |
| ·层次化的韵律特征分析 | 第47-51页 |
| ·层次化韵律特征调整的实现 | 第51-52页 |
| ·本章小结 | 第52-54页 |
| 第五章 语音转换实验与结果分析 | 第54-61页 |
| ·转换流程 | 第54-55页 |
| ·训练流程 | 第54-55页 |
| ·转换流程 | 第55页 |
| ·实验的语音库 | 第55页 |
| ·语音转换实验 | 第55-61页 |
| ·语谱图 | 第55-58页 |
| ·ABX测试 | 第58-59页 |
| ·MOS打分 | 第59页 |
| ·说话人识别测试 | 第59-61页 |
| 第六章 总结与展望 | 第61-63页 |
| ·工作总结 | 第61-62页 |
| ·展望 | 第62-63页 |
| 参考文献 | 第63-67页 |
| 攻读硕士期间公开发表的论文 | 第67-68页 |
| 致谢 | 第68页 |