基于互信息理论的说话人识别研究
第一章 绪论 | 第1-24页 |
·说话人识别基本概念 | 第13-16页 |
·面向闭集和开集的说话人辨认 | 第14页 |
·基于文本和文本无关的说话人识别 | 第14-15页 |
·说话人识别的其它方式 | 第15-16页 |
·说话人识别技术的应用 | 第16-18页 |
·说话人识别技术的特点 | 第18页 |
·说话人识别技术的难点 | 第18-21页 |
·说话人本身的变化因素 | 第19页 |
·声音掩饰与仿冒 | 第19-20页 |
·技术因素 | 第20-21页 |
·本文研究工作的意义、基本思路与主要内容 | 第21-24页 |
·研究意义 | 第21页 |
·国内外研究现状 | 第21-22页 |
·研究思路 | 第22-23页 |
·主要研究工作与创新 | 第23-24页 |
第二章 自动说话人识别原理与分析 | 第24-36页 |
·特征提取 | 第25-29页 |
·线性预测系数LPC | 第26-27页 |
·线性预测倒谱系数LPCC | 第27-28页 |
·Mel频率尺度倒谱系数MFCC | 第28-29页 |
·说话人模型与匹配 | 第29-34页 |
·基于VQ的码本模型CBM | 第29-32页 |
·基于GMM的说话人识别 | 第32-33页 |
·其它的说话人模型 | 第33-34页 |
·决策与判决 | 第34-36页 |
第三章 语音信号处理与互信息理论基础 | 第36-54页 |
·语音的声学感知特性分析 | 第36-43页 |
·语谱图分析 | 第37-38页 |
·韵律特征分析 | 第38-39页 |
·感知特性分析 | 第39-41页 |
·说话人个性特征分析 | 第41-43页 |
·傅立叶频谱分析 | 第43-45页 |
·语音信号短时频谱分析 | 第45-50页 |
·短时窗的功能 | 第45-48页 |
·短时帧长度与移动步长 | 第48页 |
·语音信号的预增强 | 第48-50页 |
·小波变换分析 | 第50-52页 |
·互信息理论基础 | 第52-54页 |
第四章 语音信号互信息的计算 | 第54-72页 |
·语音信号互信息的计算分析 | 第55-57页 |
·互信息估计的线性映射匹配算法LPM | 第57-58页 |
·互信息估计的非线性搜索匹配算法NLM | 第58-60页 |
·互信息测度的聚类特性分析 | 第60-68页 |
·类内凝聚度分析 | 第61-63页 |
·类间耦合度分析 | 第63-65页 |
·类内类间平均距离比分析 | 第65-66页 |
·类间重叠分析 | 第66-68页 |
·基于互信息匹配的语音识别 | 第68-70页 |
·数字语音识别实验 | 第68-69页 |
·语音识别济览器VoiceIE | 第69-70页 |
·连续语音识别实验 | 第70页 |
·结论 | 第70-72页 |
第五章 互信息应用在基于文本的说话人识别 | 第72-83页 |
·互信息匹配识别原理 | 第73-76页 |
·多模板说话人模型MTM | 第73-75页 |
·基于模式的非线性搜索互信息匹配与识别判决 | 第75-76页 |
·其它匹配识别方法 | 第76-77页 |
·DTW区配识别方法 | 第76-77页 |
·GMM区配识别方法 | 第77页 |
·实验分析 | 第77-81页 |
·识别性能分析 | 第78-80页 |
·识别性能与特征参数的关系 | 第80-81页 |
·运算效率分析 | 第81页 |
·结论 | 第81-83页 |
第六章 互信息应用在文本无关的说话人识别 | 第83-95页 |
·说话人的全特征矢量集模型 | 第83-84页 |
·多级最小最大搜索匹配算法与判决准则 | 第84-88页 |
·基于互信息评估的文本无关说话人识别原理 | 第85页 |
·多级最小最大搜索匹配算法MMS | 第85-87页 |
·最大互信息判决MMI | 第87-88页 |
·实验分析与比较 | 第88-93页 |
·实验数据、环境与条件 | 第88-89页 |
·全特征矢量集大小分析 | 第89-91页 |
·CFC-MMS的识别性能分析 | 第91-92页 |
·CFC-MMS与GMM的识别性能比较 | 第92-93页 |
·结论 | 第93-95页 |
第七章 总结、讨论与展望 | 第95-101页 |
·互信息理论的说话人识别应用 | 第95-97页 |
·特征参数的有效性分析 | 第97-98页 |
·说话人特征子空间分离 | 第98-99页 |
·说话人模型的自适应 | 第99-101页 |
参考文献 | 第101-108页 |
攻读博士学位期间公开发表和已录用的论文 | 第108-109页 |
致谢 | 第109-111页 |