基于动态贝叶斯网络的音视频语音识别模型研究

摘要	第1-5页
ABSTRACT	第5-7页
目录	第7-9页
第一章绪论	第9-17页
·课题来源及研究意义	第9-11页
·DBN语音识别研究的历史及现状	第11-13页
·国内外研究历史	第11-13页
·现状分析及解决方案	第13页
·研究所做工作以及文章的安排	第13-17页
第二章基于HMM的音视频语音识别和切分	第17-33页
·隐马尔可夫模型	第17-18页
·定义	第17-18页
·推理算法	第18页
·学习算法	第18页
·基于HMM的连续语音识别系统	第18-25页
·系统架构	第19页
·基本建模单元选择	第19-21页
·基于HMM的语音训练和识别过程	第21-25页
·音视频语音识别实验	第25-32页
·实验环境和数据准备	第25-26页
·音视频语音特征提取	第26-30页
·音(视)频语音识别实验	第30-32页
·本章小结	第32-33页
第三章图模型和动态贝叶斯网络	第33-55页
·图模型	第33-34页
·贝叶斯网络	第34-36页
·动态贝叶斯网络	第36-46页
·定义	第36-37页
·推理算法	第37-45页
·学习算法	第45-46页
·HMM与DBN区别	第46-48页
·结构描述比较	第46-48页
·算法比较	第48页
·GMTK工具包简介	第48-53页
·GMTK主要特性	第49-51页
·GMTK语言(GMTKL)	第51-53页
·本章小结	第53-55页
第四章基于DBN的音视频语音识别和切分	第55-71页
·基于整词-状态的单流DBN语音识别模型	第55-56页
·基于整词-音素(视素)的单流DBN语音识别模型	第56-62页
·整词-音素(视素)DBN模型结构设计	第56-58页
·整词-状态DBN与整词-音素DBN模型结构比较	第58-59页
·整词-音素DBN模型各结点条件概率分布	第59-62页
·基于DBN的音视频语音识别系统	第62-64页
·模型脚本文件配置	第62-63页
·模型结构训练和识别过程	第63-64页
·音视频语音识别实验	第64-68页
·词识别率(Corr)统计结果及分析	第64-66页
·词识别精度(Acc)统计结果及分析	第66-68页
·音视频流切分实验	第68-69页
·切分评测标准	第68页
·切分结果及实例分析	第68-69页
·本章小结	第69-71页
第五章结论与展望	第71-75页
·工作总结	第71-73页
·讨论与展望	第73-75页
参考文献	第75-78页
发表论文和参加科研情况	第78-79页
致谢	第79-80页