自然口语语音识别中的声学建模研究
摘要 | 第5-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第12-28页 |
1.1 课题研究背景与意义 | 第12-13页 |
1.2 语音识别发展和现状 | 第13-15页 |
1.3 语音识别基本框架 | 第15-24页 |
1.3.1 特征提取及处理 | 第16-20页 |
1.3.2 声学模型 | 第20-21页 |
1.3.3 语言模型 | 第21-22页 |
1.3.4 词典 | 第22-23页 |
1.3.5 解码器 | 第23-24页 |
1.4 语音识别存在的问题 | 第24-25页 |
1.5 课题来源及主要研究内容 | 第25-27页 |
1.6 论文的结构安排 | 第27-28页 |
第2章 基于 HMM 的声学建模 | 第28-58页 |
2.1 引言 | 第28页 |
2.2 基于 HMM 的声学模型 | 第28-39页 |
2.2.1 HMM | 第28-32页 |
2.2.2 似然值的计算 | 第32-35页 |
2.2.3 HMM 的解码问题 | 第35-36页 |
2.2.4 上下文相关模型 | 第36-39页 |
2.3 声学模型训练 | 第39-48页 |
2.3.1 最大似然估计 | 第39-42页 |
2.3.2 区分性训练 | 第42-48页 |
2.4 声学模型自适应 | 第48-57页 |
2.4.1 MAP 自适应 | 第49-51页 |
2.4.2 基于线性变换的自适应 | 第51-57页 |
2.4.3 基于聚类的自适应 | 第57页 |
2.5 本章小结 | 第57-58页 |
第3章 汉语连续语音识别中三音子模型的优化 | 第58-68页 |
3.1 引言 | 第58-59页 |
3.2 汉语连续语音识别中的建模单元 | 第59-60页 |
3.3 决策树状态聚类 | 第60-63页 |
3.4 初始三音子模型训练的优化策略 | 第63-65页 |
3.5 实验分析 | 第65-66页 |
3.6 本章小结 | 第66-68页 |
第4章 区分性最大后验概率自适应 | 第68-87页 |
4.1 引言 | 第68页 |
4.2 区分性训练中的参数更新算法 | 第68-78页 |
4.2.1 MMI 估计参数更新算法 | 第68-75页 |
4.2.2 MPE 估计参数更新算法 | 第75-78页 |
4.3 区分性 MAP | 第78-81页 |
4.3.1 MMI-MAP | 第80页 |
4.3.2 MPE-MAP | 第80-81页 |
4.4 改进的 MPE-MAP 算法 | 第81-83页 |
4.4.1 MPE-MMI-MAP | 第81-82页 |
4.4.2 MPE-H-MAP | 第82-83页 |
4.5 实验分析 | 第83-86页 |
4.6 本章小结 | 第86-87页 |
第5章 区分性线性变换自适应 | 第87-101页 |
5.1 引言 | 第87页 |
5.2 区分性线性变换 | 第87-91页 |
5.2.1 MMILR | 第88-90页 |
5.2.2 MPELR | 第90-91页 |
5.3 区分性线性变换中的平滑方法 | 第91-96页 |
5.3.1 基于均值先验的平滑 | 第92-93页 |
5.3.2 实验分析 | 第93-96页 |
5.4 区分性最大后验概率线性回归 | 第96-100页 |
5.4.1 算法描述 | 第96-98页 |
5.4.2 实验分析 | 第98-100页 |
5.5 本章小结 | 第100-101页 |
第6章 一种快速自适应算法 | 第101-107页 |
6.1 LP | 第101-103页 |
6.2 基于变换矩阵的 LP | 第103-104页 |
6.3 实验分析 | 第104-106页 |
6.3.1 有监督自适应 | 第104-105页 |
6.3.2 无监督自适应 | 第105-106页 |
6.4 本章小结 | 第106-107页 |
第7章 总结与展望 | 第107-109页 |
7.1 本文工作总结 | 第107-108页 |
7.2 工作展望 | 第108-109页 |
参考文献 | 第109-119页 |
攻读学位期间发表论文与研究成果清单 | 第119-120页 |
致谢 | 第120-121页 |
作者简介 | 第121页 |