基于推荐语音活动检测的视频字幕算法设计及实现

摘要	第4-5页
Abstract	第5页
第1章绪论	第10-16页
1.1 课题背景	第10-11页
1.2 本文的主要工作内容	第11-14页
1.2.1 语音识别模块	第12页
1.2.2 语音活动检测	第12-14页
1.2.3 基于语音识别的视频字幕系统	第14页
1.3 本文的组织结构	第14-15页
1.4 本章小结	第15-16页
第2章相关工作和理论基础	第16-28页
2.1 语音活动检测基础	第16-21页
2.1.1 语音活动检测简介与基本原理	第16页
2.1.2 语音活动检测几种分类	第16-17页
2.1.3 语音活动检测算法	第17-21页
2.2 系统技术基础	第21-27页
2.2.1 语音识别技术	第21-24页
2.2.2 视频转换技术	第24-27页
2.3 本章小结	第27-28页
第3章基于Gammatone滤波器组语音活动检测算法	第28-43页
3.1 语音活动检测算法	第28-29页
3.2 基于Gammatone滤波器组的推荐语音活动检测算法	第29-36页
3.2.1 相关技术基础理论	第30-32页
3.2.2 推荐语音活动检测算法流程	第32-35页
3.2.3 推荐语音活动检测参数选定算法	第35-36页
3.3 实验结果展示	第36-41页
3.3.1 数据集	第36-37页
3.3.2 衡量指标	第37-38页
3.3.3 数据对比	第38-41页
3.3.4 结果与分析	第41页
3.4 本章小结	第41-43页
第4章基于语音活动检测的字幕校正算法	第43-53页
4.1 研究背景	第43-44页
4.2 推荐活动语音活动检测实现流程	第44-47页
4.2.1 双门限端点检测算法结果展示	第44-45页
4.2.2 基于Gammatone滤波器组的推荐语音活动检测算法展示	第45-46页
4.2.3 数据集结果展示	第46-47页
4.3 语音活动检测字幕二分校正策略	第47-50页
4.4 推荐语音活动端点检测校正实验	第50-52页
4.4.1 数据集	第50页
4.4.2 衡量指标	第50-51页
4.4.3 结果与分析	第51-52页
4.5 本章小结	第52-53页
第5章基于推荐语音活动检测的视频字幕系统实现	第53-63页
5.1 系统实现环境	第53页
5.2 数据库设计	第53-55页
5.3 视频爬取流程	第55-57页
5.4 语音识别实现与字幕文件生成实现	第57-59页
5.5 系统效果呈现	第59-61页
5.5.1 系统主界面	第59-60页
5.5.2 视频播放界面效果展示	第60-61页
5.6 本章小结	第61-63页
第6章总结与展望	第63-65页
6.1 总结	第63-64页
6.2 展望	第64-65页
参考文献	第65-69页
致谢	第69页