摘要 | 第1-8页 |
ABSTRACT | 第8-13页 |
第一章 说话人识别概述 | 第13-25页 |
·绪论 | 第13-16页 |
·说话人识别系统 | 第13-15页 |
·说话人识别研究意义 | 第15-16页 |
·说话人识别研究的方法 | 第16-20页 |
·常用的识别特征矢量 | 第16-18页 |
·参考模型和模式匹配方法 | 第18-20页 |
·语音信号的非线性研究 | 第20-22页 |
·语音信号发音过程的非线性性质 | 第20-21页 |
·国内外研究现状 | 第21-22页 |
·主要研究工作与创新 | 第22-24页 |
·说话人识别的数据库 | 第24-25页 |
第二章 语音信号分析和说话人识别 | 第25-38页 |
·语音特征的提取 | 第25-31页 |
·线性预测系数(LPC)及其倒谱系数(LPCC) | 第26-28页 |
·Mel 频率倒谱系数(MFCC) | 第28-31页 |
·基于分形的语音特征 | 第31-32页 |
·说话人识别的方法 | 第32-38页 |
·矢量量化模型 | 第32-34页 |
·高斯混合模型 | 第34-38页 |
第三章 语音信号的混沌性 | 第38-55页 |
·混沌的普遍性 | 第38-40页 |
·语音空气动力学与分形 | 第40-41页 |
·汉语语音信号的相空间重构 | 第41-49页 |
·延迟时间τ的选取 | 第43-48页 |
·嵌入维数的确定 | 第48-49页 |
·LYAPUNOV 指数和汉语语音信号混沌性的验证 | 第49-54页 |
·最大Lyapunov 指数的计算 | 第51-52页 |
·汉语语音混沌性的验证 | 第52-54页 |
·本章小结 | 第54-55页 |
第四章 汉语语音的分形参数计算和分析 | 第55-71页 |
·分形维数 | 第55-64页 |
·分形维数的定义 | 第56-59页 |
·语音信号关联维数的计算 | 第59-64页 |
·二阶动态熵 | 第64-65页 |
·二阶动态熵的定义 | 第64-65页 |
·语音信号的二阶动态熵 | 第65页 |
·多重分形 | 第65-70页 |
·多重分形的定义 | 第65-67页 |
·语音信号的广义维数 | 第67-70页 |
·本章小结 | 第70-71页 |
第五章 语音信号的广义维数在说话人识别中的应用 | 第71-80页 |
·基于广义维数的说话人识别 | 第71-73页 |
·“与文本有关”的说话人辨认实验和结果 | 第72-73页 |
·“与文本无关”的讲话者辨认实验和结果 | 第73页 |
·基于马氏距离说话人辨认 | 第73-75页 |
·马氏距离 | 第73-74页 |
·降维的广义维数 | 第74页 |
·识别性能的改进 | 第74-75页 |
·基于改变帧长的广义维数的说话人辨认 | 第75-78页 |
·帧长对广义维数的准确度的影响 | 第76-77页 |
·改变帧长对说话人识别的影响 | 第77-78页 |
·本章小结 | 第78-80页 |
第六章 说话人常用特征与非线性特征融合 | 第80-94页 |
·信息融合原理 | 第80-86页 |
·信息融合的分类 | 第80-82页 |
·多分类器融合的类型 | 第82-83页 |
·多分类器融合的方法 | 第83-86页 |
·基于特征层融合的说话人辨认 | 第86-89页 |
·构建高维矢量法的融合实现 | 第86-88页 |
·构建复数矢量法的融合实现 | 第88-89页 |
·基于决策层融合的说话人辨认 | 第89-92页 |
·串联形式的说话人辨认实验及分析 | 第89-91页 |
·并联形式的说话人辨认实验及分析 | 第91-92页 |
·本章小结 | 第92-94页 |
第七章 总结和展望 | 第94-98页 |
·非线性理论的说话人识别应用 | 第94-96页 |
·信息融合的有关问题及解决办法 | 第96-97页 |
·非线性理论在说话人识别应用进一步研究的展望 | 第97-98页 |
参考文献 | 第98-104页 |
攻读博士学位期间公开发表和已录用的论文 | 第104页 |
攻读博士学位期间完成的科研项目 | 第104-105页 |
致谢 | 第105-106页 |
发表意见书 | 第106-107页 |
博硕士学位论文同意发表声明 | 第107页 |