首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于人脸和语音深度特征融合的说话人识别与标注算法研究

摘要第3-4页
abstract第4-5页
第1章 引言第8-17页
    1.1 课题背景及研究意义第8-9页
    1.2 多生物特征融合第9-11页
    1.3 基于人脸和语音的特征融合研究现状第11-15页
    1.4 论文内容与组织结构第15-16页
    1.5 本章小节第16-17页
第2章 深度学习相关理论介绍第17-27页
    2.1 几种典型深度学习基础方法介绍第17-23页
        2.1.1 受限玻尔兹曼机第17-19页
        2.1.2 卷积神经网络第19-21页
        2.1.3 递归神经网络第21-23页
    2.2 多模深度学习介绍第23-26页
    2.3 本章小结第26-27页
第3章 基于多模关联深度神经网络的人脸和语音特征融合算法第27-47页
    3.1 引言第27-28页
    3.2 人脸和语音的特征提取第28-32页
        3.2.1 基于自定义卷积层的人脸特征提取第28-31页
        3.2.2 语音特征MFCCs提取第31-32页
    3.3 多样化特征融合特征层融合算法第32-39页
        3.3.1 特征层拼接融合第34-35页
        3.3.2 特征层深度特征非线性拼接融合第35-37页
        3.3.3 决策层特征相加融合第37-38页
        3.3.4 决策层深度特征非线性相加融合第38-39页
    3.4 实验结果与分析第39-46页
        3.4.1 数据集:Friends第39-40页
        3.4.2 实验设置第40-41页
        3.4.3 人脸模型第41-42页
        3.4.4 人脸语音多模型第42-46页
    3.5 本章小结第46-47页
第4章 基于注意力机制的人脸语音特征融合及说话人标注算法第47-72页
    4.1 引言第47-49页
    4.2 说话人标注相关工作第49-51页
        4.2.1 基于单模型的说话人标注方法第49-50页
        4.2.2 基于多模型的说话人标注方法第50-51页
    4.3 说话人标注模型第51-62页
        4.3.1 问题与解决方法公式化第52-53页
        4.3.2 基于VGG-face的人脸特征提取方法第53页
        4.3.3 基于LSTM或卷积的语音特征提取方法第53-57页
        4.3.4 共性语义显著性特征方法第57-59页
        4.3.5 基于低秩矩阵分解的双线性融合方法第59-62页
    4.4 实验与结果分析第62-71页
        4.4.1 数据预处理第64-65页
        4.4.2 评价标准第65-66页
        4.4.3 语音编码模块性能与分析第66-67页
        4.4.4 说话人标注性能与分析第67-71页
    4.5 本章小结第71-72页
第5章 结束语第72-76页
    5.1 本文工作总结第72-73页
    5.2 本文工作展望第73-76页
参考文献第76-82页
致谢第82-84页
个人简历、在学期间发表的学术论文与研究成果第84页

论文共84页,点击 下载论文
上一篇:基于深度神经网络的程序分类技术研究
下一篇:小鼠睡眠检测干预闭环混合智能系统设计与实现