摘要 | 第1-7页 |
ABSTRAC | 第7-9页 |
第一章 绪论 | 第9-13页 |
·本论文的研究目的和意义 | 第9-10页 |
·论文的难点 | 第10-11页 |
·论文研究内容和组织结构 | 第11-12页 |
·创新点 | 第12-13页 |
第二章 语音识别技术概述 | 第13-21页 |
·语音识别的分类 | 第13-14页 |
·语音识别方法 | 第14-16页 |
·基于语言学和声学的方法 | 第14-15页 |
·模板匹配的方法 | 第15页 |
·人工神经网络的方法 | 第15-16页 |
·语音识别发展历史及现状 | 第16-21页 |
·藏语语音识别技术的研究现状 | 第17-21页 |
第三章 藏语语音识别系统研究 | 第21-48页 |
·藏语语音基本特点 | 第21-27页 |
·藏语语音生理属性 | 第21-24页 |
·藏文的音节结构 | 第24-26页 |
·藏语方言 | 第26-27页 |
·藏语语音识别系统结构 | 第27页 |
·语音信号处理与分析 | 第27-31页 |
·语音信号的数字化处理 | 第28页 |
·语音信号的预处理 | 第28-29页 |
·语音信号的特征提取 | 第29-31页 |
·线性预测倒谱系数 | 第30页 |
·美尔倒谱系数 | 第30-31页 |
·藏语语音识别基元的选择 | 第31-33页 |
·语音识别基元选取原则 | 第31页 |
·藏语语音识别基元的选取 | 第31-33页 |
·藏语语音识别语音语料库的收集与标注 | 第33-37页 |
·文本语料的收集和整理 | 第34页 |
·语音数据的采集及整理 | 第34页 |
·语音库标注 | 第34-37页 |
·语料标注 | 第34-37页 |
·语音标注 | 第37页 |
·藏语发音字典的建立 | 第37-39页 |
·语言模型 | 第39-41页 |
·语言模型的分类 | 第39-41页 |
·文法语言模型 | 第40页 |
·统计语言模型 | 第40-41页 |
·声学模型 | 第41-48页 |
·隐马尔科夫模型 | 第42-44页 |
·隐马尔科夫模型的三个问题及其基本解决方案 | 第44-48页 |
·问题1的求解——前向后向算法 | 第44-46页 |
·问题2的求解——Vterbi算法 | 第46页 |
·问题3的求解——Baum-Welch算法 | 第46-48页 |
第四章 藏语语音识别系统实现 | 第48-78页 |
·利用HTK工具包实现藏语小词汇量连续语音识别系统(实验 1) | 第48-70页 |
·HTK工具包介绍 | 第48-51页 |
·HTK工具包结构 | 第48-49页 |
·HTK工具包训练模型流程 | 第49-51页 |
·藏语小词汇量连续语音识别技术的具体实现 | 第51-69页 |
·准备数据 | 第53-57页 |
·模型训练 | 第57-62页 |
·创建绑定状态的三音素模型 | 第62-66页 |
·任务语法文件 | 第66-67页 |
·识别器评估 | 第67-69页 |
·实验结果分析 | 第69-70页 |
·识别基元对识别率的影响 | 第69-70页 |
·语言模型对识别率的影响 | 第70页 |
·基于LD3320 芯片实现的藏语语音识别系统 (实验 2) | 第70-78页 |
·LD3320 简介 | 第70-72页 |
·利用LD3320 语音识别专用芯片实现的藏语语音识别 | 第72-75页 |
·基于HTK工具包和基于LD3320 语音识别芯片的识别率比较 | 第75-78页 |
·基于HTK的藏语孤立词识别 | 第75-76页 |
·基于LD3320 语音识别芯片的藏语孤立词识别 | 第76-78页 |
第五章 总结与展望 | 第78-80页 |
·总结 | 第78-79页 |
·展望 | 第79-80页 |
参考文献 | 第80-82页 |
附录 | 第82-87页 |
攻读学位期间发表的学术论文目录 | 第87页 |
攻读学位期间参加过的科研项目 | 第87-88页 |
致谢 | 第88页 |