基于音视频的双模态语音识别技术研究

摘要	第1-4页
Abstract	第4-6页
目录	第6-8页
1 绪论	第8-13页
·本课题的研究背景和意义	第8-9页
·课题的背景	第8页
·研究的意义	第8-9页
·音视频双模态语音识别概述	第9-12页
·国内外研究现状	第9-10页
·音视频双模态语音识别的应用	第10-12页
·本文的研究内容与结构	第12-13页
2 音频信号处理	第13-28页
·语音信号预处理	第13-14页
·语音信号数字化	第13-14页
·预加重	第14页
·分帧和加窗	第14页
·语音端点检测	第14-24页
·传统的双门限端点检测算法	第15-17页
·本文改进的语音端点检测算法	第17-19页
·实验结果与分析	第19-24页
·语音特征提取	第24-27页
·语音特征参数	第24-25页
·LPCC参数和MFCC参数	第25页
·MFCC特征参数提取过程	第25-27页
·本章小结	第27-28页
3 视频信号处理	第28-43页
·人脸检测与嘴唇区域粗定位	第28-29页
·基于OpenCV的人脸检测技术	第28-29页
·检测效果	第29页
·嘴唇分割	第29-37页
·色彩空间介绍	第29-31页
·经典嘴唇分割算法	第31-32页
·基于Lab空间的嘴唇分割算法	第32-37页
·嘴唇轮廓特征提取方法	第37-42页
·基于模型的方法	第37-39页
·基于像素的方法	第39页
·混合特征提取方法	第39-42页
·本章小结	第42-43页
4 音视频融合及识别	第43-58页
·音视频融合	第43-44页
·音视频融合方法	第43-44页
·基于加权的音视频决策融合	第44页
·语音识别算法	第44-48页
·语音识别模型	第44-45页
·DTW语音识别算法	第45-47页
·改进的DTW算法	第47-48页
·音视频双模态语音识别系统的设计与测试	第48-57页
·音视频双模态语音识别系统设计	第48-51页
·系统性能测试与分析	第51-57页
·本章小结	第57-58页
5 结论与展望	第58-60页
·工作总结	第58页
·未来展望	第58-60页
参考文献	第60-63页
申请学位期间的研究成果及发表的学术论文	第63-64页
致谢	第64页