首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

语音唇动关联性分析方法研究及其在录音回放检测中的应用

摘要第5-7页
Abstract第7-9页
主要缩写对照表第16-18页
第一章 绪论第18-29页
    1.1 课题研究背景与意义第18-21页
    1.2 语音唇动一致性分析概述第21-26页
        1.2.1 录音回放攻击检测研究现状第21-23页
        1.2.2 一致性分析国内外研究现状第23-26页
    1.3 论文的主要工作与章节安排第26-29页
第二章 数据准备及实验平台搭建第29-45页
    2.1 音视频双模态数据库概述第29-32页
    2.2 语音唇动不一致数据分类及构建第32-33页
    2.3 选用的英文双模态数据库第33-36页
        2.3.1 VidTIMIT数据库第33-34页
        2.3.2 CUAVE数据库第34-35页
        2.3.3 自建补充数据库第35-36页
    2.4 选用的中文双模态数据库第36-38页
        2.4.1 通用中文双模态数据库第36-37页
        2.4.2 汉语韵母发音单元数据库第37-38页
    2.5 音视频双模态录音回放检测平台第38-44页
        2.5.1 系统功能及设计要求第38-39页
        2.5.2 系统总体结构第39-40页
        2.5.3 系统功能模块第40-43页
        2.5.4 其他实验平台和工具第43-44页
    2.6 本章小结第44-45页
第三章 基于时空相关度融合的语音唇动一致性判决方法第45-69页
    3.1 语音唇动相关度分析第45-50页
        3.1.1 语音唇动时域关联性数学模型第45-47页
        3.1.2 基于协惯量的相关度分析方法第47-50页
    3.2 语音唇动时延概念及其估算方法第50-55页
        3.2.1 时延定义及其产生原因第50-51页
        3.2.2 时延估计第51-52页
        3.2.3 时延搜索范围第52-53页
        3.2.4 时延估算准确性分析第53-55页
    3.3 时延分布范围统计第55-58页
        3.3.1 语音唇动一致数据时延分布第55-56页
        3.3.2 各类不一致数据时延分布第56-57页
        3.3.3 时延以及相关度区分性分析第57-58页
    3.4 基于时空相关度融合的语音唇动一致性分析方法第58-64页
        3.4.1 唇部运动时空分析模型第58-60页
        3.4.2 时空域语音唇动相关度分析第60-61页
        3.4.3 一致性评分策略第61-62页
        3.4.4 时空域相关度得分融合第62-64页
    3.5 实验结果与分析第64-68页
        3.5.1 实验设置第64-65页
        3.5.2 实验结果分析第65-68页
    3.6 本章小结第68-69页
第四章 基于音视频时空移不变学习字典的语音唇动一致性判决方法第69-91页
    4.1 移不变语音唇动表示模型第69-74页
        4.1.1 移不变稀疏表示第69-71页
        4.1.2 时序信号移不变稀疏表示模型第71-73页
        4.1.3 语音唇动联合表示模型第73-74页
    4.2 音视频联合字典学习算法第74-83页
        4.2.1 联合字典学习问题描述第74-76页
        4.2.2 改进的移不变匹配追踪算法第76-80页
        4.2.3 音视频联合稀疏编码第80-82页
        4.2.4 联合字典更新第82-83页
    4.3 基于移不变联合字典的一致性评分策略第83-85页
    4.4 实验结果与分析第85-89页
        4.4.1 实验设置第85-86页
        4.4.2 小词汇量数据实验结果分析第86-87页
        4.4.3 大词汇量数据实验结果分析第87-89页
    4.5 本章小结第89-91页
第五章 基于代表性发音事件的语音唇动一致性分析第91-111页
    5.1 发音事件分割第91-98页
        5.1.1 代表性发音事件选择第91-92页
        5.1.2 基于两步切分的音节唇动序列分割第92-95页
        5.1.3 音视频结合声韵母分割第95-98页
    5.2 基于韵母发音事件匹配及位置时延分析的一致性分析方法第98-101页
    5.3 特定发音单元语音唇动关联性分析第101-105页
        5.3.1 韵母视素聚类第101-103页
        5.3.2 韵母类发音单元的相关度分析第103页
        5.3.3 特定发音单元选取第103-104页
        5.3.4 基于特定韵母发音单元的一致性分析第104-105页
    5.4 实验与结果分析第105-109页
        5.4.1 韵母发音事件分割准确性分析第105-106页
        5.4.2 一致性分析实验设置第106-107页
        5.4.3 各章算法比较分析第107-109页
    5.5 本章小结第109-111页
总结与展望第111-114页
    研究总结第111-113页
    后续工作展望第113-114页
参考文献第114-126页
攻读博士学位期间取得的研究成果第126-128页
致谢第128-129页
附件第129页

论文共129页,点击 下载论文
上一篇:超高分辨率显示系统若干关键技术的研究及实现
下一篇:论景观权及其法律保护