首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

语音转换的关键技术研究

图目录第1-11页
表目录第11-12页
摘要第12-14页
ABSTRACT第14-16页
第一章 绪论第16-22页
 1.1 语音转换定义第16页
 1.2 语音转换的意义第16-17页
 1.3 语音转换研究的历史和现状第17-19页
 1.4 目前语音转换达到的性能状况及存在问题第19页
 1.5 本文的研究目标及主要工作第19-20页
 1.6 论文内容安排第20-22页
第二章 语音转换的相关问题介绍第22-34页
 2.1 引言第22页
 2.2 语音产生机理第22-23页
 2.3 人的发生器官的差异及声学参数的差异第23-26页
  2.3.1 不同人喉部生理结构差异及与声源有关的声学参数第23-25页
  2.3.2 不同人声道生理结构差异及与声道有关的声学参数第25-26页
 2.4 语音个性特征参数第26-28页
  2.4.1 语音个性特征的声学参数的区别及分类第26-28页
  2.4.2 声学参数对语音个性特征的贡献比较第28页
  2.4.3 不同音素对语音个性特征的贡献比较第28页
 2.5 语音转换系统第28-31页
  2.5.1 语音转换的目的和分类第28-29页
  2.5.2 语音转换系统结构和组成第29-31页
 2.6 语音转换性能测试方法第31-33页
  2.6.1 客观测试方法第31-32页
  2.6.2 主观测试方法第32-33页
 2.7 本章小结第33-34页
第三章 韵律值建模及转换方法第34-37页
 3.1 引言第34页
 3.2 基音周期值的建模和转换第34-35页
  3.2.1 以平均基音周期比值为变化率转换法第34页
  3.2.2 高斯模型转换法第34-35页
  3.2.3 句子码书模型转换方法第35页
  3.2.4 Fujisaki模型转换方法第35页
 3.3 时长值的建模和转换第35-36页
 3.4 能量变换第36页
 3.5 本章小结第36-37页
第四章 韵律转换实现方法第37-71页
 4.1 引言第37-39页
 4.2 TD-PSOLA韵律变换法第39-45页
  4.2.1 TD-PSOLA韵律变换实现方法第39-40页
  4.2.2 窗长的选择第40-45页
  4.2.3 TD-PSOLA韵律变换法的优点和缺点第45页
 4.3 基于分段线性相位模型的FD-PSOLA韵律变换法第45-59页
  4.3.1 压缩-扩展法(compression-expansion)第46-50页
  4.3.2 删除-复制法(elimination-repetition)第50-51页
  4.3.3 分段线性相位建模第51-59页
 4.4 伪谐波基音周期变换法研究第59-70页
  4.4.1 语音分析及伪谐波语音模型的提出第59-60页
  4.4.2 伪谐波语音模型的分析和参数提取第60-62页
  4.4.3 基于伪谐波语音模型的语音合成第62-63页
  4.4.4 伪谐波语音模型的时长变换法第63-65页
  4.4.5 基于伪谐波语音模型谐波平移基音周期变换法第65-69页
  4.4.6 基于伪谐波语音模型的删除-复制基音周期变换法第69-70页
 4.5 本章小结第70-71页
第五章 频谱包络表示的相关问题第71-90页
 5.1 引言第71-72页
 5.2 线性预测分析法第72-73页
 5.3 基于幅度谱包络求LPC系数及LPC谱包络第73-75页
 5.4 反射系数第75页
 5.5 对数面积比系数第75-76页
 5.6 由LPC系数求解LPC倒谱(LPCC)第76-77页
 5.7 由LPC系数求解 PLAR第77-78页
 5.8 LPC系数与LSF相互转换第78-84页
  5.8.1 由LPC系数向LSF参数转换第80-82页
  5.8.2 由LSF系数向LPC参数转换第82-84页
 5.9 基于幅度谱包络求 CEP倒谱及 CEP倒谱包络第84-86页
 5.10 基于幅度谱包络求 MFCC及 MFCC-线性谱包络第86-88页
 5.11 基于MFCC-线性谱包络和 CEP谱包络的混合谱包络第88-89页
 5.12 本章小结第89-90页
第六章 频谱包络转换方法第90-96页
 6.1 引言第90页
 6.2 矢量量化法第90页
 6.3 说话人插值法第90-91页
 6.4 线性多变量回归法第91页
 6.5 动态频率规整(DFW)第91-92页
 6.6 神经网络法第92页
 6.7 高斯混合模型法(GMM)第92-93页
 6.8 基于重采样法第93页
 6.9 HMM法第93-94页
 6.10 用全通函数进行频谱弯折第94页
 6.11 本章小结第94-96页
第七章 用双线性转换函数进行非线性频谱搬移第96-136页
 7.1 引言第96-97页
 7.2 双线性转换函数第97-99页
 7.3 基于系统单位冲激响应进行频谱搬移第99-115页
  7.3.1 语音的 LPC分析第99页
  7.3.2 系统单位冲激响应数的两种求解方法第99-100页
  7.3.3 频谱搬移后的系统单位冲激响应求解第100-103页
  7.3.4 基于系统单位冲激响应进行频谱搬移第103-104页
  7.3.5 不同音的系统单位冲激响应收敛情况分析第104-107页
  7.3.6 系统单位冲激响应收敛情况对谱包络的影响第107页
  7.3.7 系统单位冲激响应收敛情况对语音分析合成的影响第107-108页
  7.3.8 分析帧长不同对系统单位冲激响应收敛情况的影响第108-110页
  7.3.9 LPC阶数不同对系统单位冲激响应收敛情况的影响第110-111页
  7.3.10 频谱搬移对系统单位冲激响应收敛情况的影响第111-113页
  7.3.11 语音信号采样频率不同频谱搬移的影响第113页
  7.3.12 频谱搬移实验第113-115页
 7.4 由频谱搬移后的系统单位冲激响应求解频谱搬移后 LPC系数的方法第115-117页
 7.5 基于DFT变换求频谱搬移后 LPC系数的方法第117-121页
 7.6 基于 LPC谱包络和 DFT分析的频谱弯折第121-123页
 7.7 基于LPCC谱包络和 DFT分析的频谱弯折第123-126页
  7.7.1 基于LPC系数求 LPCC谱包络第124页
  7.7.2 插值法求弯折 LPCC谱包络第124-125页
  7.7.3 递推法求弯折 LPCC系数第125-126页
 7.8 基于 DCT倒谱包络和 DFT分析进行谱包络弯折第126-131页
  7.8.1 基于弯折后的 DFT变换求弯折后倒谱谱包络第127页
  7.8.2 基于弯折函数插值求弯折后倒谱谱包络第127-128页
  7.8.3 基于递推法求弯折后倒谱谱包络第128-129页
  7.8.4 频谱弯折实验第129-131页
 7.9 不同的 LPC系数求解方法对频谱搬移性能的影响第131-132页
 7.10 频谱弯折参数值自动获取方法第132-134页
 7.11 本章小结第134-136页
第八章 对频谱倾斜进行校正处理第136-146页
 8.1 引言第136页
 8.2 临界倾斜滤波器第136-138页
 8.3 运用临界倾斜滤波器来进行频谱倾斜补偿第138-142页
 8.4 频谱倾斜补偿参数自动提取第142-144页
 8.5 本章小结第144-146页
第九章 基于小语料库训练的语音转换系统第146-153页
 9.1 引言第146-147页
 9.2 基于小语料库训练的语音转换系统第147-151页
 9.3 语音转换效果评估第151-152页
 9.4 本章小结第152-153页
第十章 结束语第153-155页
 10.1 本文所作的主要工作第153-154页
 10.2 后继的研究工作第154-155页
致谢第155-156页
参考文献表第156-165页
附录第165-176页
 附录1第165-169页
 附录2第169-175页
 附录3第175-176页
攻读博士学位期间发表的论文第176-177页

论文共177页,点击 下载论文
上一篇:设备e-维护模式的体系理论与关键技术研究
下一篇:科华焊割设备制造有限公司管理软件系统的设计与实现