首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

面向压缩语音的说话人识别技术的研究

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第10-16页
    1.1 课题研究背景第10-11页
    1.2 说话人识别发展脉络概述第11页
    1.3 针对压缩语音的说话人识别概述第11-13页
        1.3.1 针对压缩语音说话人识别概述第11-12页
        1.3.2 针对压缩语音说话人识别历史和研究现状第12-13页
    1.4 本文的主要研究内容以及研究成果第13-14页
    1.5 论文的组织结构第14-16页
第二章 说话人识别相关理论基础第16-32页
    2.1 引言第16页
    2.2 说话人识别系统概述第16-17页
    2.3 语音特征提取第17-19页
        2.3.1 时域特征第17-18页
        2.3.2 频域特征第18-19页
    2.4 Ⅰ-vector说话人模型建立第19-22页
        2.4.1 Ⅰ-vector基本思想第19-20页
        2.4.2 UBM估计第20-21页
        2.4.3 总体变化空间矩阵估计第21-22页
        2.4.4 Ⅰ-vector的提取第22页
    2.5 模式匹配第22-26页
        2.5.1 余弦距离计算第23页
        2.5.2 马氏距离计算第23页
        2.5.3 PLDA模型度量第23-26页
    2.6 得分融合机器学习基础第26-28页
        2.6.1 逻辑回归第26-27页
        2.6.2 支撑向量机第27-28页
    2.7 说话人识别系统的性能评价第28-31页
    2.8 本章小结第31-32页
第三章 基于Ⅰ-vector的说话人识别系统第32-46页
    3.1 引言第32页
    3.2 基于Ⅰ-vector的说话人识别系统架构设计第32-33页
    3.3 语音前端处理第33-34页
        3.3.1 特征提取第33页
        3.3.2 静音去除第33-34页
        3.3.3 特征后处理第34页
    3.4 Ⅰ-vector处理技术第34-36页
        3.4.1 Ⅰ-vector规整技术第34-35页
        3.4.2 Ⅰ-vector说话人模型选择第35-36页
    3.5 基于Ⅰ-vector系统信道补偿技术第36-38页
        3.5.1 线性鉴别分析第36-37页
        3.5.2 类内协方差规整技术第37-38页
        3.5.3 LDA结合WCCN技术第38页
    3.6 得分规整第38-41页
        3.6.1 Z-Norm第38-39页
        3.6.2 T-Norm第39-40页
        3.6.3 基于cohort的得分规整第40-41页
    3.7 基础系统性能分析第41-45页
        3.7.1 静音去除性能分析第41-42页
        3.7.2 系统UBM维度、T矩阵维度调整第42-43页
        3.7.3 模式匹配测试第43页
        3.7.4 LDA性能测试第43-44页
        3.7.5 得分规整性能测试第44-45页
    3.8 本章小结第45-46页
第四章 针对压缩语音的说话人识别特征研究第46-70页
    4.1 引言第46页
    4.2 声码器概述第46-49页
        4.2.1 声码器原理概述第46-47页
        4.2.2 G.723.1编码器原理概述第47-49页
    4.3 短时谱特征在压缩语音环境下性能分析第49-58页
        4.3.1 PNCC特征概述第49页
        4.3.2 PNCC特征提取流程第49-54页
        4.3.3 压缩语音对不同短时谱特征的影响第54-56页
        4.3.4 PNCC、MFCC说话人识别鲁棒性分析第56-58页
    4.4 编码比特流特征用于说话人识别第58-62页
        4.4.1 G.723.1编码比特流介绍第58-59页
        4.4.2 比特流中短时谱特征的提取第59-60页
        4.4.3 比特流中激励特征的提取第60-61页
        4.4.4 比特流特征用于说话人识别系统第61页
        4.4.5 比特流特征性能分析第61-62页
    4.5 谱重心频率特征第62-67页
        4.5.1 谱重心频率特征提取第62-64页
        4.5.2 F_0特征第64-65页
        4.5.3 谱重心频率与基频结合第65页
        4.5.4 谱重心频率的性能分析第65-67页
    4.6 本章小结第67-70页
第五章 针对压缩语音的说话人识别系统第70-80页
    5.1 引言第70页
    5.2 针对压缩语音的说话人识别系统架构第70-71页
    5.3 系统融合策略第71-73页
        5.3.1 Ⅰ-vector特征融合第71-72页
        5.3.2 得分融合第72-73页
    5.4 系统融合实验第73-76页
        5.4.1 Ⅰ-vector融合实验结果第74页
        5.4.2 得分融合实验结果第74-76页
    5.5 系统性能分析与总结第76-78页
    5.6 本章小结第78-80页
第六章 总结与展望第80-82页
    6.1 论文工作总结第80页
    6.2 未来研究展望第80-82页
参考文献第82-86页
致谢第86-88页
攻读学位期间发表的学术论文目录第88页

论文共88页,点击 下载论文
上一篇:关键词检测技术的研究及应用
下一篇:D2D通信干扰管理技术研究