首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于拓展和聚类的情感鲁棒说话人识别研究

摘要第1-6页
Abstract第6-15页
第1章 绪论第15-23页
   ·引言第15-16页
   ·说话人识别概述第16-18页
   ·情感语音对说话人识别的影响第18-20页
   ·消除情感对说话人识别影响的困难第20-21页
   ·论文主要工作第21-23页
第2章 说话人识别系统第23-35页
   ·说话人识别系统框架第23-24页
   ·特征提取第24-29页
     ·美尔倒谱系数(MFCC)第26-28页
     ·线性预测系数(LPC)第28-29页
   ·说话人模型第29-32页
     ·主流说话人模型简介第29-31页
     ·高斯混合模型(GMM)第31-32页
   ·说话人识别性能评价第32-33页
     ·错误接受率和错误拒绝率第32-33页
     ·等错误率和DET曲线第33页
   ·本章小结第33-35页
第3章 情感语音与存在情感影响的说话人识别研究现状第35-49页
   ·情感的描述与分类第35-38页
     ·情感的描述第36-38页
     ·情感的分类第38页
   ·情感语音数据库第38-40页
     ·实验室表演第39-40页
     ·自然口音选录第40页
   ·情感语音特征及其变化规律第40-43页
     ·基频特征第40-41页
     ·能量(Intensity)音强第41页
     ·语速(duration)音长第41-42页
     ·韵律结构和重音第42页
     ·音质第42-43页
   ·情感语音的合成第43-45页
     ·如何提高语音的自然度第43-44页
     ·现有的技术和方法第44-45页
   ·情感语音下的说话人识别第45-48页
   ·本章小结第48-49页
第4章 说话人识别系统性能受情感语音影响的研究第49-69页
   ·说话人系统设置第49-51页
     ·MASC CCNT实验语音数据库第49页
     ·EPST实验语音数据库第49-50页
     ·基本参数设置第50-51页
   ·情感语音对说话人系统的影响第51-66页
     ·基准实验第51-52页
     ·训练语料文本相关性对系统性能的影响第52-54页
     ·训练语料文本情感性对系统性能的影响第54-57页
     ·不同训练情感语料数量对系统性能的影响第57-59页
     ·不同建模方法对对系统性能的影响第59-63页
     ·不同取得分策略对系统性能的影响第63-64页
     ·不同背景模型对系统性能的影响第64-66页
   ·建设抗情感变化的说话人系统的对策第66页
   ·基于拓展和聚类的情感鲁棒说话人识别模型第66-68页
   ·本章小结第68-69页
第5章 基于规则的特征修正方法第69-83页
   ·算法思想第69-70页
   ·特征的统计分析第70-73页
     ·音强分析第71-72页
     ·时长分析第72页
     ·基频分析第72-73页
   ·特征修正第73-76页
     ·对音强的修正第73-74页
     ·对发音持续时间的修正第74-75页
     ·对基音频率的修正第75-76页
   ·说话人建模与识别第76-77页
   ·实验结果计分析第77-82页
     ·相同文本和不同文本的比较第77-78页
     ·基于修正的情感特征与真实情感特征的比较第78-80页
     ·不同修正情感语音数量的比较第80-81页
     ·基于不同韵律特征修正的比较第81-82页
   ·本章小结第82-83页
第6章 基于情感模型间参数迁移规律的特征映射方法第83-95页
   ·算法思想第83-84页
   ·模型参数迁移学习第84-88页
     ·通用背景模型(UBM)第84-85页
     ·情感相关模型第85-86页
     ·迁移参数选择第86-88页
   ·特征映射第88-89页
   ·实验及讨论第89-94页
     ·不同UBM训练集的比较第89-92页
     ·与通用GMM-UBM的比较第92-94页
   ·本章小结第94-95页
第7章 基于情感语音聚类的说话人建模方法第95-112页
   ·算法思想第95-97页
   ·语音聚类模型第97-99页
   ·韵律特征选取及语音分割第99-103页
     ·语音分割第99-100页
     ·韵律特征计算第100-101页
     ·语音段表达式生成第101页
     ·说话人性别判断第101-102页
     ·确定聚类中心第102-103页
     ·对训练语音进行聚类第103页
   ·说话人建模第103-104页
   ·实验结果及分析第104-111页
     ·建模方式比较实验第104-107页
     ·不同语料数量的比较第107-109页
     ·不同韵律特征的比较第109-111页
   ·本章小结第111-112页
第8章 基于语音帧加权的得分规整算法第112-130页
   ·算法思想第112-113页
   ·得分规整分析第113-116页
     ·得分计算第113-114页
     ·语音帧规整第114-116页
   ·得分规整算法第116-121页
     ·log域上的得分规整第116-118页
     ·规整算法第118-119页
     ·规整函数第119-121页
   ·实验结果计分析第121-125页
     ·不同权重函数的比较第121-124页
     ·不同规整方法的比较第124-125页
   ·不同层次情感补偿方法的比较第125-129页
     ·MASC库上的实验第126-127页
     ·EPST库上的实验第127-129页
   ·本章小结第129-130页
第9章 总结和展望第130-134页
   ·总结第130-131页
   ·未来的工作方法第131-134页
附录1第134-137页
参考文献第137-148页
攻读博士学位期间主要的研究成果第148-150页
致谢第150-151页
作者简历第151页

论文共151页,点击 下载论文
上一篇:扫描体造型技术研究
下一篇:面向自治计算的自动服务协商研究