语音转换的关键技术研究

图目录	第1-11页
表目录	第11-12页
摘要	第12-14页
ABSTRACT	第14-16页
第一章绪论	第16-22页
1．1 语音转换定义	第16页
1．2 语音转换的意义	第16-17页
1．3 语音转换研究的历史和现状	第17-19页
1．4 目前语音转换达到的性能状况及存在问题	第19页
1．5 本文的研究目标及主要工作	第19-20页
1．6 论文内容安排	第20-22页
第二章语音转换的相关问题介绍	第22-34页
2．1 引言	第22页
2．2 语音产生机理	第22-23页
2．3 人的发生器官的差异及声学参数的差异	第23-26页
2．3．1 不同人喉部生理结构差异及与声源有关的声学参数	第23-25页
2．3．2 不同人声道生理结构差异及与声道有关的声学参数	第25-26页
2．4 语音个性特征参数	第26-28页
2．4．1 语音个性特征的声学参数的区别及分类	第26-28页
2．4．2 声学参数对语音个性特征的贡献比较	第28页
2．4．3 不同音素对语音个性特征的贡献比较	第28页
2．5 语音转换系统	第28-31页
2．5．1 语音转换的目的和分类	第28-29页
2．5．2 语音转换系统结构和组成	第29-31页
2．6 语音转换性能测试方法	第31-33页
2．6．1 客观测试方法	第31-32页
2．6．2 主观测试方法	第32-33页
2．7 本章小结	第33-34页
第三章韵律值建模及转换方法	第34-37页
3．1 引言	第34页
3．2 基音周期值的建模和转换	第34-35页
3．2．1 以平均基音周期比值为变化率转换法	第34页
3．2．2 高斯模型转换法	第34-35页
3．2．3 句子码书模型转换方法	第35页
3．2．4 Fujisaki模型转换方法	第35页
3．3 时长值的建模和转换	第35-36页
3．4 能量变换	第36页
3．5 本章小结	第36-37页
第四章韵律转换实现方法	第37-71页
4．1 引言	第37-39页
4．2 TD-PSOLA韵律变换法	第39-45页
4．2．1 TD-PSOLA韵律变换实现方法	第39-40页
4．2．2 窗长的选择	第40-45页
4．2．3 TD-PSOLA韵律变换法的优点和缺点	第45页
4．3 基于分段线性相位模型的FD-PSOLA韵律变换法	第45-59页
4．3．1 压缩-扩展法(compression-expansion)	第46-50页
4．3．2 删除-复制法(elimination-repetition)	第50-51页
4．3．3 分段线性相位建模	第51-59页
4．4 伪谐波基音周期变换法研究	第59-70页
4．4．1 语音分析及伪谐波语音模型的提出	第59-60页
4．4．2 伪谐波语音模型的分析和参数提取	第60-62页
4．4．3 基于伪谐波语音模型的语音合成	第62-63页
4．4．4 伪谐波语音模型的时长变换法	第63-65页
4．4．5 基于伪谐波语音模型谐波平移基音周期变换法	第65-69页
4．4．6 基于伪谐波语音模型的删除-复制基音周期变换法	第69-70页
4．5 本章小结	第70-71页
第五章频谱包络表示的相关问题	第71-90页
5．1 引言	第71-72页
5．2 线性预测分析法	第72-73页
5．3 基于幅度谱包络求LPC系数及LPC谱包络	第73-75页
5．4 反射系数	第75页
5．5 对数面积比系数	第75-76页
5．6 由LPC系数求解LPC倒谱(LPCC)	第76-77页
5．7 由LPC系数求解 PLAR	第77-78页
5．8 LPC系数与LSF相互转换	第78-84页
5．8．1 由LPC系数向LSF参数转换	第80-82页
5．8．2 由LSF系数向LPC参数转换	第82-84页
5．9 基于幅度谱包络求 CEP倒谱及 CEP倒谱包络	第84-86页
5．10 基于幅度谱包络求 MFCC及 MFCC-线性谱包络	第86-88页
5．11 基于MFCC-线性谱包络和 CEP谱包络的混合谱包络	第88-89页
5．12 本章小结	第89-90页
第六章频谱包络转换方法	第90-96页
6．1 引言	第90页
6．2 矢量量化法	第90页
6．3 说话人插值法	第90-91页
6．4 线性多变量回归法	第91页
6．5 动态频率规整(DFW)	第91-92页
6．6 神经网络法	第92页
6．7 高斯混合模型法(GMM)	第92-93页
6．8 基于重采样法	第93页
6．9 HMM法	第93-94页
6．10 用全通函数进行频谱弯折	第94页
6．11 本章小结	第94-96页
第七章用双线性转换函数进行非线性频谱搬移	第96-136页
7．1 引言	第96-97页
7．2 双线性转换函数	第97-99页
7．3 基于系统单位冲激响应进行频谱搬移	第99-115页
7．3．1 语音的 LPC分析	第99页
7．3．2 系统单位冲激响应数的两种求解方法	第99-100页
7．3．3 频谱搬移后的系统单位冲激响应求解	第100-103页
7．3．4 基于系统单位冲激响应进行频谱搬移	第103-104页
7．3．5 不同音的系统单位冲激响应收敛情况分析	第104-107页
7．3．6 系统单位冲激响应收敛情况对谱包络的影响	第107页
7．3．7 系统单位冲激响应收敛情况对语音分析合成的影响	第107-108页
7．3．8 分析帧长不同对系统单位冲激响应收敛情况的影响	第108-110页
7．3．9 LPC阶数不同对系统单位冲激响应收敛情况的影响	第110-111页
7．3．10 频谱搬移对系统单位冲激响应收敛情况的影响	第111-113页
7．3．11 语音信号采样频率不同频谱搬移的影响	第113页
7．3．12 频谱搬移实验	第113-115页
7．4 由频谱搬移后的系统单位冲激响应求解频谱搬移后 LPC系数的方法	第115-117页
7．5 基于DFT变换求频谱搬移后 LPC系数的方法	第117-121页
7．6 基于 LPC谱包络和 DFT分析的频谱弯折	第121-123页
7．7 基于LPCC谱包络和 DFT分析的频谱弯折	第123-126页
7．7．1 基于LPC系数求 LPCC谱包络	第124页
7．7．2 插值法求弯折 LPCC谱包络	第124-125页
7．7．3 递推法求弯折 LPCC系数	第125-126页
7．8 基于 DCT倒谱包络和 DFT分析进行谱包络弯折	第126-131页
7．8．1 基于弯折后的 DFT变换求弯折后倒谱谱包络	第127页
7．8．2 基于弯折函数插值求弯折后倒谱谱包络	第127-128页
7．8．3 基于递推法求弯折后倒谱谱包络	第128-129页
7．8．4 频谱弯折实验	第129-131页
7．9 不同的 LPC系数求解方法对频谱搬移性能的影响	第131-132页
7．10 频谱弯折参数值自动获取方法	第132-134页
7．11 本章小结	第134-136页
第八章对频谱倾斜进行校正处理	第136-146页
8．1 引言	第136页
8．2 临界倾斜滤波器	第136-138页
8．3 运用临界倾斜滤波器来进行频谱倾斜补偿	第138-142页
8．4 频谱倾斜补偿参数自动提取	第142-144页
8．5 本章小结	第144-146页
第九章基于小语料库训练的语音转换系统	第146-153页
9．1 引言	第146-147页
9．2 基于小语料库训练的语音转换系统	第147-151页
9．3 语音转换效果评估	第151-152页
9．4 本章小结	第152-153页
第十章结束语	第153-155页
10．1 本文所作的主要工作	第153-154页
10．2 后继的研究工作	第154-155页
致谢	第155-156页
参考文献表	第156-165页
附录	第165-176页
附录1	第165-169页
附录2	第169-175页
附录3	第175-176页
攻读博士学位期间发表的论文	第176-177页