摘要 | 第1-7页 |
ABSTRACT(英文摘要) | 第7-13页 |
主要符号对照表 | 第13-14页 |
第一章 绪论 | 第14-27页 |
·引言 | 第14页 |
·语音信号处理的发展与现状 | 第14-16页 |
·语音信号特征提取与识别技术简介 | 第16-24页 |
·语音特征提取与识别框架 | 第16-17页 |
·语音识别 | 第17-20页 |
·隐马尔科夫模型 | 第18-20页 |
·语言模型 | 第20页 |
·说话人识别 | 第20-24页 |
·高斯混合模型 | 第20-22页 |
·GMM-UBM模型 | 第22-24页 |
·目前存在的问题和所面临的挑战 | 第24-25页 |
·本文研究内容及组织结构 | 第25-27页 |
·本文的研究目的 | 第25页 |
·本文的研究内容 | 第25页 |
·本文的组织结构 | 第25-27页 |
第二章 复杂环境下语音特征提取技术概述 | 第27-44页 |
·语音信号特征参数 | 第27-29页 |
·线性预测分析 | 第27-28页 |
·基于听觉特性的特征系数 | 第28-29页 |
·特征补偿与正则化技术 | 第29-31页 |
·模型补偿 | 第31-32页 |
·基于变换域的语音特征 | 第32-33页 |
·单声道语音增强 | 第33-39页 |
·谱减(Spectral Substraction) | 第33-34页 |
·子带滤波方法 | 第34-35页 |
·子空间方法 | 第35-36页 |
·Kalman滤波 | 第36-38页 |
·Wiener滤波 | 第38-39页 |
·小波变换 | 第39页 |
·多通道语音增强 | 第39-43页 |
·自适应波束形成器 | 第40-41页 |
·盲信号分离技术 | 第41-43页 |
·本章小结 | 第43-44页 |
第三章 基于皮层表征模型和张量分解的鲁棒语音识别 | 第44-76页 |
·张量代数概述 | 第44-52页 |
·定义与运算 | 第46-49页 |
·张量分解 | 第49-52页 |
·PARAFAC分解模型 | 第50页 |
·Tucker分解模型 | 第50-51页 |
·非负张量分解模型 | 第51-52页 |
·非负张量主分量分析 | 第52-58页 |
·非负稀疏主分量分析 | 第52-53页 |
·非负张量主分量分析算法 | 第53-56页 |
·时间复杂度分析 | 第56页 |
·收敛性分析 | 第56-58页 |
·基于皮层表征模型的语音特征提取 | 第58-66页 |
·基于Gabor函数的皮层表征 | 第58-60页 |
·多线性张量分析与稀疏约束 | 第60-65页 |
·特征提取框架 | 第65-66页 |
·实验结果分析与讨论 | 第66-75页 |
·Grid数据集实验结果与分析 | 第66-69页 |
·Grid数据集 | 第66-67页 |
·实验设置 | 第67页 |
·结果分析 | 第67-69页 |
·Aurora2数据集实验结果与分析 | 第69-71页 |
·Aurora2数据集 | 第69-70页 |
·实验设置 | 第70页 |
·结果分析 | 第70-71页 |
·讨论 | 第71-75页 |
·本章小结 | 第75-76页 |
第四章 基于外围听觉模型与独立子空间分析的说话人识别 | 第76-92页 |
·独立子空间分析 | 第76-79页 |
·基于外围听觉系统模型的语音特征提取 | 第79-86页 |
·外围听觉系统的生理结构 | 第79页 |
·基于耳蜗能量谱的听觉特征 | 第79-82页 |
·独立子空间分析与特征变换 | 第82-85页 |
·特征提取框架 | 第85-86页 |
·实验结果分析 | 第86-90页 |
·实验数据集与实验设置 | 第86页 |
·特征对比 | 第86-88页 |
·结果分析 | 第88-90页 |
·本章小结 | 第90-92页 |
第五章 基于听觉感知与稀疏张量分解模型的鲁棒说话人识别 | 第92-125页 |
·约束非负张量分解算法 | 第92-98页 |
·非负矩阵分解 | 第92-94页 |
·基于正交和非平滑约束的非负张量分解算法 | 第94-98页 |
·基于稀疏张量耳蜗能量谱的说话人识别 | 第98-104页 |
·稀疏张量耳蜗能量谱特征 | 第98-101页 |
·实验结果分析 | 第101-104页 |
·ANTF特征实验结果 | 第101-102页 |
·ANTCC特征实验结果 | 第102-104页 |
·基于稀疏皮层表征模型的说话人识别 | 第104-111页 |
·稀疏张量皮层表征 | 第105-107页 |
·实验设置 | 第107-109页 |
·实验结果分析 | 第109-111页 |
·讨论 | 第111页 |
·算法验证平台设计与实现 | 第111-123页 |
·系统设计 | 第112-113页 |
·总体框架 | 第112页 |
·工作模式 | 第112-113页 |
·系统实现 | 第113-120页 |
·视听觉信号采集 | 第113-114页 |
·信号预处理 | 第114-115页 |
·声源定位 | 第115-116页 |
·人脸检测与识别 | 第116-118页 |
·多模态追踪与定位策略 | 第118页 |
·孤立词识别与说话人识别 | 第118-120页 |
·说话人身份识别实验分析与讨论 | 第120-123页 |
·本章小结 | 第123-125页 |
第六章 总结与展望 | 第125-128页 |
·本文的主要工作和创新点 | 第125-126页 |
·工作展望 | 第126-128页 |
参考文献 | 第128-142页 |
致谢 | 第142-143页 |
个人简历、在学期间的研究成果及发表的论文 | 第143-144页 |