首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

多维语音信息识别技术研究

摘要第4-6页
abstract第6-7页
专用术语注释表第10-11页
第一章 绪论第11-19页
    1.1 引言第11页
    1.2 单维说话人信息识别技术第11-16页
        1.2.1 说话人(身份)识别技术第11-13页
        1.2.2 情感识别技术第13-14页
        1.2.3 性别识别技术第14-15页
        1.2.4 传统单维识别技术和系统存在的问题第15-16页
    1.3 结构化信号处理第16-17页
    1.4 多维说话人信息识别技术第17页
    1.5 论文内容和结构安排第17-19页
第二章 多维说话人信息识别系统的基础知识第19-36页
    2.1 说话人相关信息识别系统框图第19-20页
    2.2 语音预处理第20-23页
        2.2.1 语音增强第20页
        2.2.2 预加重第20-21页
        2.2.3 端点检测第21-22页
        2.2.4 加窗分帧第22-23页
    2.3 特征参数提取第23-28页
        2.3.1 语音帧能量第23-24页
        2.3.2 基音频率第24-25页
        2.3.3 线性预测倒谱系数(LPCC)第25-26页
        2.3.4 Mel频率倒谱系数(MFCC)第26-28页
    2.4 识别模型第28-34页
        2.4.1 高斯混合模型(GMM)第28-30页
        2.4.2 支持向量机(SVM)第30-32页
        2.4.3 隐马尔可夫模型(HMM)第32-33页
        2.4.4 深度置信网络(DBN)第33-34页
    2.5 多维识别评测标准第34-35页
    2.6 本章小结第35-36页
第三章 基于基线系统的多维说话人信息识别第36-51页
    3.1 引言第36-37页
    3.2 不同单维信息识别系统对比第37-42页
        3.2.1 SVM分类器第38-40页
        3.2.2 单维系统特征参数的异同第40-41页
        3.2.3 单维系统的实验及分析第41-42页
    3.3 多维说话人信息识别系统第42-46页
        3.3.1 实验语音库第42-43页
        3.3.2 面向多维信息识别的两种融合特征参数第43-44页
        3.3.3 基线系统第44-46页
    3.4 实验结果与分析第46-50页
        3.4.1 实验参数设置第46页
        3.4.2 实验一:多维与单维系统的性能比较第46-48页
        3.4.3 实验二:基于高维特征的维数选择第48-49页
        3.4.4 实验三:高维特征与低维特征的对比第49-50页
    3.5 本章小结第50-51页
第四章 基于改进MIMLSVM的多维说话人识别系统第51-65页
    4.1 引言第51-52页
    4.2 多示例多标记学习(MIML)第52-55页
        4.2.1 多示例多标记学习框架第52-54页
        4.2.2 多示例多标记学习算法第54-55页
    4.3 改进的MIMLSVM算法第55-59页
        4.3.1 多标记方法存在的问题第55-56页
        4.3.2 MIMLSVM算法第56-57页
        4.3.3 改进的MIMLSVM算法第57-59页
    4.4 实验结果及分析第59-63页
        4.4.1 实验参数设置第59页
        4.4.2 实验一:核函数的选择第59-60页
        4.4.3 实验二:确定聚类比例第60-61页
        4.4.4 实验三:两种识别系统的比较第61-63页
    4.5 本章小结第63-65页
第五章 总结与展望第65-68页
    5.1 论文总结第65-66页
    5.2 工作展望第66-68页
参考文献第68-73页
附录1 攻读硕士学位期间撰写的论文第73-74页
附录2 攻读硕士学位期间参加的科研项目第74-75页
致谢第75页

论文共75页,点击 下载论文
上一篇:含三嗪环和磷杂菲基团的新型成炭剂的合成及其在PP中的应用
下一篇:中信银行直销银行发展策略研究