首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

音频噪声环境下唇动信息在语音识别中的应用技术研究

摘要第1-7页
Abstract第7-12页
插图索引第12-14页
表格索引第14-15页
主要缩写对照表第15-17页
第一章 绪论第17-28页
   ·课题研究意义第17-19页
   ·音视频语音识别概述第19-24页
     ·国内外研究现状第20-21页
     ·视频图像处理第21-23页
     ·音视频融合策略第23-24页
   ·本文的主要工作及贡献第24-26页
   ·论文章节安排第26-28页
第二章 音视频语音数据库介绍第28-36页
   ·音视频语音数据库概述第28-30页
   ·研究中使用的音视频语音数据库第30-35页
     ·AMP 英文双模语音数据库第30-31页
     ·中文双模态连续语音数据库第31-35页
   ·本章小结第35-36页
第三章 嘴唇区域定位和轮廓提取方法第36-54页
   ·基于多色彩空间的嘴唇区域定位算法第36-41页
     ·基于彩色梯度嘴唇边缘提取方法第37-38页
     ·基准线判准方法第38-40页
     ·嘴唇区域投影定位第40-41页
   ·基于改进GAC 模型的嘴形轮廓提取方法第41-48页
     ·传统GAC 的嘴形轮廓提取模型第42-44页
     ·GAC 模型在嘴形轮廓提取中的不足第44-45页
     ·多方向梯度信息第45页
     ·基于先验知识的水平集方法第45-48页
   ·实验结果及分析第48-53页
     ·嘴唇区域定位实验及分析第48-49页
     ·嘴形轮廓提取实验及分析第49-53页
   ·本章小结第53-54页
第四章 嘴唇动态特征提取方法第54-66页
   ·常用的视频图像特征第54-60页
     ·特征唇(Eigenlips)第55-56页
     ·DTCWT 变换第56-58页
     ·形状特征第58-59页
     ·静态特征的唇读实验结果和分析第59-60页
   ·基于帧间距离和LDA 的动态特征提取方法第60-65页
     ·帧间距离第62-63页
     ·线性判别分析第63-64页
     ·动态特征的唇读实验结果与分析第64-65页
   ·本章小结第65-66页
第五章 基于多流HMM 的音视频信息融合方法第66-93页
   ·音视频融合方法第66-71页
     ·感知融合第67-68页
     ·音视频融合级别第68-70页
     ·基于双训练模型的特征融合策略第70-71页
   ·基于MSHMM 的音视频决策融合模型第71-76页
     ·多流隐马尔科夫模型第71-74页
     ·基于N-best 的句子级音视频决策融合第74-76页
   ·基于ILP 模型最优流指数选取的决策融合方法第76-78页
     ·最大对数似然距离准则第76页
     ·ILP 模型的建立第76-77页
     ·阈值的确定第77-78页
   ·实验结果及分析第78-91页
     ·Sphinx3 简介第78-79页
     ·实验设计第79-82页
     ·AMP-AVSp 英语孤立词识别实验第82-87页
     ·BiMoSp 中文连续语音识别实验第87-90页
     ·结果分析第90-91页
   ·本章小结第91-93页
第六章 车载音视频语音控制仿真系统第93-103页
   ·车载控制系统整体结构第93-95页
   ·模拟系统的功能模块第95-101页
     ·音频语音模块第96-98页
     ·视频语音模块第98-99页
     ·音视频融合模块第99-101页
   ·在线音频语音控制系统的性能测试第101-102页
   ·本章小结第102-103页
结论第103-107页
 研究总结第103-105页
 后续工作展望第105-107页
参考文献第107-115页
攻读博士学位期间取得的研究成果第115-117页
致谢第117-119页
附录第119页

论文共119页,点击 下载论文
上一篇:基于OFDMA的宽带无线通信系统资源分配研究
下一篇:表面组装生产过程中PCB组装时间优化问题研究