首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

基于推荐语音活动检测的视频字幕算法设计及实现

摘要第4-5页
Abstract第5页
第1章 绪论第10-16页
    1.1 课题背景第10-11页
    1.2 本文的主要工作内容第11-14页
        1.2.1 语音识别模块第12页
        1.2.2 语音活动检测第12-14页
        1.2.3 基于语音识别的视频字幕系统第14页
    1.3 本文的组织结构第14-15页
    1.4 本章小结第15-16页
第2章 相关工作和理论基础第16-28页
    2.1 语音活动检测基础第16-21页
        2.1.1 语音活动检测简介与基本原理第16页
        2.1.2 语音活动检测几种分类第16-17页
        2.1.3 语音活动检测算法第17-21页
    2.2 系统技术基础第21-27页
        2.2.1 语音识别技术第21-24页
        2.2.2 视频转换技术第24-27页
    2.3 本章小结第27-28页
第3章 基于Gammatone滤波器组语音活动检测算法第28-43页
    3.1 语音活动检测算法第28-29页
    3.2 基于Gammatone滤波器组的推荐语音活动检测算法第29-36页
        3.2.1 相关技术基础理论第30-32页
        3.2.2 推荐语音活动检测算法流程第32-35页
        3.2.3 推荐语音活动检测参数选定算法第35-36页
    3.3 实验结果展示第36-41页
        3.3.1 数据集第36-37页
        3.3.2 衡量指标第37-38页
        3.3.3 数据对比第38-41页
        3.3.4 结果与分析第41页
    3.4 本章小结第41-43页
第4章 基于语音活动检测的字幕校正算法第43-53页
    4.1 研究背景第43-44页
    4.2 推荐活动语音活动检测实现流程第44-47页
        4.2.1 双门限端点检测算法结果展示第44-45页
        4.2.2 基于Gammatone滤波器组的推荐语音活动检测算法展示第45-46页
        4.2.3 数据集结果展示第46-47页
    4.3 语音活动检测字幕二分校正策略第47-50页
    4.4 推荐语音活动端点检测校正实验第50-52页
        4.4.1 数据集第50页
        4.4.2 衡量指标第50-51页
        4.4.3 结果与分析第51-52页
    4.5 本章小结第52-53页
第5章 基于推荐语音活动检测的视频字幕系统实现第53-63页
    5.1 系统实现环境第53页
    5.2 数据库设计第53-55页
    5.3 视频爬取流程第55-57页
    5.4 语音识别实现与字幕文件生成实现第57-59页
    5.5 系统效果呈现第59-61页
        5.5.1 系统主界面第59-60页
        5.5.2 视频播放界面效果展示第60-61页
    5.6 本章小结第61-63页
第6章 总结与展望第63-65页
    6.1 总结第63-64页
    6.2 展望第64-65页
参考文献第65-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:基于Hi3516E的H.265高清网络摄像机的设计与实现
下一篇:基于码率兼容LDPC码的多中继协作传输