首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于视觉信息和深度学习的中文唇语数据集构建与识别

摘要第4-5页
Abstract第5-6页
1 绪论第9-13页
    1.1 研究背景与意义第9-11页
    1.2 论文主要研究内容第11页
    1.3 论文主要贡献与章节安排第11-13页
2 唇语识别研究现状第13-21页
    2.1 传统唇语识别第13-17页
    2.2 基于深度学习的唇语识别第17-18页
    2.3 中文唇语识别现状第18-20页
    2.4 本章小结第20-21页
3 中文唇语数据集的构建第21-40页
    3.1 数据选择来源第22-23页
    3.2 人脸检测第23-29页
    3.3 唇部检测第29-30页
    3.4 音频分割第30-33页
    3.5 字幕变化检测第33-36页
    3.6 语音识别第36页
    3.7 数据集构建结果第36-39页
    3.8 本章小结第39-40页
4 中文唇语识别第40-55页
    4.1 汉字转音素第40-43页
    4.2 端到端的唇语识别网络设计第43-45页
    4.3 唇语识别网络效果验证第45-54页
    4.4 本章小结第54-55页
5 总结与展望第55-56页
致谢第56-57页
参考文献第57-60页

论文共60页,点击 下载论文
上一篇:基于卷积神经网络的图像质量评价
下一篇:高清LED控制系统中灰度算法的研究与实现