首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

无需脚本的动态字幕生成中的关键技术研究

致谢第7-8页
摘要第8-9页
ABSTRACT第9页
第一章 绪论第15-23页
    1.1 研究背景与意义第15-18页
    1.2 国内外研究现状第18-19页
    1.3 系统概述第19-21页
    1.4 论文的创新点及章节安排第21-23页
        1.4.1 本文的研究创新点第21-22页
        1.4.2 本文章节内容安排第22-23页
第二章 相关理论第23-30页
    2.1 自动语音识别第23-27页
        2.1.1 动态时间规整算法第23-25页
        2.1.2 隐马尔可夫模型第25-27页
    2.2 人脸检测与唇动分析第27-29页
        2.2.1 人脸检测第27-28页
        2.2.2 唇动分析第28-29页
    2.3 本章小结第29-30页
第三章 说话人分割聚类技术第30-54页
    3.1 引言第30-32页
        3.1.1 说话人分割聚类系统概述第30-31页
        3.1.2 本章内容安排第31-32页
    3.2 参数提取与话者建模第32-35页
        3.2.1 语音参数的提取第32-33页
        3.2.2 话者模型的建立第33-35页
    3.3 距离测度的选择与聚类停止准则第35-38页
        3.3.1 距离测度第35-37页
        3.3.2 贝叶斯判据简介第37-38页
    3.4 说话人分割第38-44页
        3.4.1 本章选用的算法第38-40页
        3.4.2 实验及分析第40-44页
    3.5 说话人聚类第44-50页
        3.5.1 本章选用的算法第45-46页
        3.5.2 实验及分析第46-50页
    3.6 分割聚类系统的实验及分析第50-53页
        3.6.1 系统的评价指标第50-51页
        3.6.2 实验及分析第51-53页
    3.7 本章小结第53-54页
第四章 人脸与字幕的匹配第54-69页
    4.1 语音序列与图像序列的预处理第54-56页
    4.2 “只有一个人说话”时的人脸与语音的匹配第56-58页
    4.3 特殊情况下的人脸与语音的匹配第58-60页
    4.4 语音盲源分离技术第60-68页
        4.4.1 ICA第60-61页
        4.4.2 FastICA第61-62页
        4.4.3 本文使用的方案第62-63页
        4.4.4 实验及分析第63-68页
    4.5 本章小结第68-69页
第五章 总结与展望第69-71页
    5.1 本文的工作总结第69-70页
    5.2 研究展望第70-71页
参考文献第71-77页
攻读硕士学位期间的学术活动及成果情况第77页

论文共77页,点击 下载论文
上一篇:常熟电气机械产业信息服务平台设计与实现
下一篇:基于CECBP与显著区域特征决策的人脸表情识别算法研究