非母语说话人发音空间建模方法的研究

摘要	第2-3页
ABSTRACT	第3-4页
第1章绪论	第7-18页
1.1 研究的背景和意义	第7-8页
1.2 非母语说话人语音识别的研究现状	第8-11页
1.2.1 声学模型自适应	第9-10页
1.2.2 发音字典自适应	第10-11页
1.3 研究的理论依据及所要突破的难题	第11-16页
1.3.1 研究的理论依据	第11-14页
1.3.2 研究中所要突破的难题	第14-16页
1.4 研究的方法以及创新点	第16-17页
1.5 论文的结构安排	第17-18页
第2章基于标准发音字典的语音识别	第18-29页
2.1 引言	第18页
2.2 使用标准普通话进行声学建模	第18-24页
2.2.1 汉语识别基元的选择	第18-20页
2.2.2 上下文相关模型中的状态共享	第20-23页
2.2.3 高斯混合分裂(mixture splitting)	第23-24页
2.3 标准普通话模型的识别结果	第24-26页
2.4 使用标准模型存在的问题	第26-28页
2.5 本章小结	第28-29页
第3章多发音字典的构造方法	第29-37页
3.1 引言	第29-30页
3.2 基于音素的多发音字典	第30-35页
3.2.1 基于人工总结获取音素的发音映射	第31-32页
3.2.2 基于数据驱动的方法获取音素的发音映射	第32-35页
3.3 基于音节的多发音字典构造方法	第35页
3.4 发音字典的剪枝策略	第35-36页
3.4.1 剪枝策略的选取	第35-36页
3.5 剪枝以后的音素和音节映射进行规则发音字典的扩展	第36页
3.6 本章小结	第36-37页
第4章多发音字典构造识别器	第37-41页
4.1 引言	第37页
4.2 多发音字典和标准声学模型结合	第37-39页
4.3 本章小结	第39-41页
第5章实验结果与分析	第41-56页
5.1 引言	第41-42页
5.2 标准普通话识别器	第42-45页
5.2.1 主元音和声韵母建模用于标准普通话说话人的识别结果对比	第42-45页
5.3 使用多发音字典构造识别器	第45-56页
5.3.1 基于人工总结的方法获取多发音字典	第45-46页
5.3.2 基于数据驱动的方法获取多发音字典	第46-56页
第6章总结和展望	第56-59页
6.1 总结	第56页
6.2 展望	第56-59页
参考文献	第59-63页
作者在攻读硕士学位期间发表的论文	第63-64页
致谢	第64-65页