图目录 | 第1-11页 |
表目录 | 第11-12页 |
摘要 | 第12-14页 |
ABSTRACT | 第14-16页 |
第一章 绪论 | 第16-22页 |
1.1 语音转换定义 | 第16页 |
1.2 语音转换的意义 | 第16-17页 |
1.3 语音转换研究的历史和现状 | 第17-19页 |
1.4 目前语音转换达到的性能状况及存在问题 | 第19页 |
1.5 本文的研究目标及主要工作 | 第19-20页 |
1.6 论文内容安排 | 第20-22页 |
第二章 语音转换的相关问题介绍 | 第22-34页 |
2.1 引言 | 第22页 |
2.2 语音产生机理 | 第22-23页 |
2.3 人的发生器官的差异及声学参数的差异 | 第23-26页 |
2.3.1 不同人喉部生理结构差异及与声源有关的声学参数 | 第23-25页 |
2.3.2 不同人声道生理结构差异及与声道有关的声学参数 | 第25-26页 |
2.4 语音个性特征参数 | 第26-28页 |
2.4.1 语音个性特征的声学参数的区别及分类 | 第26-28页 |
2.4.2 声学参数对语音个性特征的贡献比较 | 第28页 |
2.4.3 不同音素对语音个性特征的贡献比较 | 第28页 |
2.5 语音转换系统 | 第28-31页 |
2.5.1 语音转换的目的和分类 | 第28-29页 |
2.5.2 语音转换系统结构和组成 | 第29-31页 |
2.6 语音转换性能测试方法 | 第31-33页 |
2.6.1 客观测试方法 | 第31-32页 |
2.6.2 主观测试方法 | 第32-33页 |
2.7 本章小结 | 第33-34页 |
第三章 韵律值建模及转换方法 | 第34-37页 |
3.1 引言 | 第34页 |
3.2 基音周期值的建模和转换 | 第34-35页 |
3.2.1 以平均基音周期比值为变化率转换法 | 第34页 |
3.2.2 高斯模型转换法 | 第34-35页 |
3.2.3 句子码书模型转换方法 | 第35页 |
3.2.4 Fujisaki模型转换方法 | 第35页 |
3.3 时长值的建模和转换 | 第35-36页 |
3.4 能量变换 | 第36页 |
3.5 本章小结 | 第36-37页 |
第四章 韵律转换实现方法 | 第37-71页 |
4.1 引言 | 第37-39页 |
4.2 TD-PSOLA韵律变换法 | 第39-45页 |
4.2.1 TD-PSOLA韵律变换实现方法 | 第39-40页 |
4.2.2 窗长的选择 | 第40-45页 |
4.2.3 TD-PSOLA韵律变换法的优点和缺点 | 第45页 |
4.3 基于分段线性相位模型的FD-PSOLA韵律变换法 | 第45-59页 |
4.3.1 压缩-扩展法(compression-expansion) | 第46-50页 |
4.3.2 删除-复制法(elimination-repetition) | 第50-51页 |
4.3.3 分段线性相位建模 | 第51-59页 |
4.4 伪谐波基音周期变换法研究 | 第59-70页 |
4.4.1 语音分析及伪谐波语音模型的提出 | 第59-60页 |
4.4.2 伪谐波语音模型的分析和参数提取 | 第60-62页 |
4.4.3 基于伪谐波语音模型的语音合成 | 第62-63页 |
4.4.4 伪谐波语音模型的时长变换法 | 第63-65页 |
4.4.5 基于伪谐波语音模型谐波平移基音周期变换法 | 第65-69页 |
4.4.6 基于伪谐波语音模型的删除-复制基音周期变换法 | 第69-70页 |
4.5 本章小结 | 第70-71页 |
第五章 频谱包络表示的相关问题 | 第71-90页 |
5.1 引言 | 第71-72页 |
5.2 线性预测分析法 | 第72-73页 |
5.3 基于幅度谱包络求LPC系数及LPC谱包络 | 第73-75页 |
5.4 反射系数 | 第75页 |
5.5 对数面积比系数 | 第75-76页 |
5.6 由LPC系数求解LPC倒谱(LPCC) | 第76-77页 |
5.7 由LPC系数求解 PLAR | 第77-78页 |
5.8 LPC系数与LSF相互转换 | 第78-84页 |
5.8.1 由LPC系数向LSF参数转换 | 第80-82页 |
5.8.2 由LSF系数向LPC参数转换 | 第82-84页 |
5.9 基于幅度谱包络求 CEP倒谱及 CEP倒谱包络 | 第84-86页 |
5.10 基于幅度谱包络求 MFCC及 MFCC-线性谱包络 | 第86-88页 |
5.11 基于MFCC-线性谱包络和 CEP谱包络的混合谱包络 | 第88-89页 |
5.12 本章小结 | 第89-90页 |
第六章 频谱包络转换方法 | 第90-96页 |
6.1 引言 | 第90页 |
6.2 矢量量化法 | 第90页 |
6.3 说话人插值法 | 第90-91页 |
6.4 线性多变量回归法 | 第91页 |
6.5 动态频率规整(DFW) | 第91-92页 |
6.6 神经网络法 | 第92页 |
6.7 高斯混合模型法(GMM) | 第92-93页 |
6.8 基于重采样法 | 第93页 |
6.9 HMM法 | 第93-94页 |
6.10 用全通函数进行频谱弯折 | 第94页 |
6.11 本章小结 | 第94-96页 |
第七章 用双线性转换函数进行非线性频谱搬移 | 第96-136页 |
7.1 引言 | 第96-97页 |
7.2 双线性转换函数 | 第97-99页 |
7.3 基于系统单位冲激响应进行频谱搬移 | 第99-115页 |
7.3.1 语音的 LPC分析 | 第99页 |
7.3.2 系统单位冲激响应数的两种求解方法 | 第99-100页 |
7.3.3 频谱搬移后的系统单位冲激响应求解 | 第100-103页 |
7.3.4 基于系统单位冲激响应进行频谱搬移 | 第103-104页 |
7.3.5 不同音的系统单位冲激响应收敛情况分析 | 第104-107页 |
7.3.6 系统单位冲激响应收敛情况对谱包络的影响 | 第107页 |
7.3.7 系统单位冲激响应收敛情况对语音分析合成的影响 | 第107-108页 |
7.3.8 分析帧长不同对系统单位冲激响应收敛情况的影响 | 第108-110页 |
7.3.9 LPC阶数不同对系统单位冲激响应收敛情况的影响 | 第110-111页 |
7.3.10 频谱搬移对系统单位冲激响应收敛情况的影响 | 第111-113页 |
7.3.11 语音信号采样频率不同频谱搬移的影响 | 第113页 |
7.3.12 频谱搬移实验 | 第113-115页 |
7.4 由频谱搬移后的系统单位冲激响应求解频谱搬移后 LPC系数的方法 | 第115-117页 |
7.5 基于DFT变换求频谱搬移后 LPC系数的方法 | 第117-121页 |
7.6 基于 LPC谱包络和 DFT分析的频谱弯折 | 第121-123页 |
7.7 基于LPCC谱包络和 DFT分析的频谱弯折 | 第123-126页 |
7.7.1 基于LPC系数求 LPCC谱包络 | 第124页 |
7.7.2 插值法求弯折 LPCC谱包络 | 第124-125页 |
7.7.3 递推法求弯折 LPCC系数 | 第125-126页 |
7.8 基于 DCT倒谱包络和 DFT分析进行谱包络弯折 | 第126-131页 |
7.8.1 基于弯折后的 DFT变换求弯折后倒谱谱包络 | 第127页 |
7.8.2 基于弯折函数插值求弯折后倒谱谱包络 | 第127-128页 |
7.8.3 基于递推法求弯折后倒谱谱包络 | 第128-129页 |
7.8.4 频谱弯折实验 | 第129-131页 |
7.9 不同的 LPC系数求解方法对频谱搬移性能的影响 | 第131-132页 |
7.10 频谱弯折参数值自动获取方法 | 第132-134页 |
7.11 本章小结 | 第134-136页 |
第八章 对频谱倾斜进行校正处理 | 第136-146页 |
8.1 引言 | 第136页 |
8.2 临界倾斜滤波器 | 第136-138页 |
8.3 运用临界倾斜滤波器来进行频谱倾斜补偿 | 第138-142页 |
8.4 频谱倾斜补偿参数自动提取 | 第142-144页 |
8.5 本章小结 | 第144-146页 |
第九章 基于小语料库训练的语音转换系统 | 第146-153页 |
9.1 引言 | 第146-147页 |
9.2 基于小语料库训练的语音转换系统 | 第147-151页 |
9.3 语音转换效果评估 | 第151-152页 |
9.4 本章小结 | 第152-153页 |
第十章 结束语 | 第153-155页 |
10.1 本文所作的主要工作 | 第153-154页 |
10.2 后继的研究工作 | 第154-155页 |
致谢 | 第155-156页 |
参考文献表 | 第156-165页 |
附录 | 第165-176页 |
附录1 | 第165-169页 |
附录2 | 第169-175页 |
附录3 | 第175-176页 |
攻读博士学位期间发表的论文 | 第176-177页 |