第一章 绪论 | 第1-33页 |
·选题与研究意义 | 第14-16页 |
·研究背景与课题来源 | 第16-17页 |
·说话人识别技术综述 | 第17-24页 |
·说话人识别的定义 | 第17-19页 |
·说话人识别中的特征分析 | 第19-20页 |
·说话人模型 | 第20-23页 |
·背景模型 | 第23-24页 |
·研究难点和发展方向 | 第24-27页 |
·说话人语音的变化 | 第24-25页 |
·影响说话人识别性能的其它因素 | 第25-26页 |
·说话人识别技术的发展方向 | 第26-27页 |
·本文所做的工作和创新 | 第27-29页 |
·本文的组织 | 第29页 |
参考文献 | 第29-33页 |
第二章 噪音下的语音检测与噪声消减 | 第33-54页 |
·引言 | 第33页 |
·噪音条件下的语音检测 | 第33-45页 |
·常用的特征参数 | 第34-38页 |
·基于置信度的动态多特征检测方法(RM-DMF) | 第38-42页 |
·实验与结果分析 | 第42-45页 |
·噪音消减技术比较 | 第45-51页 |
·谱相减算法与误差补偿 | 第46-50页 |
·多通道增强方法 | 第50-51页 |
·小结 | 第51-52页 |
参考文献 | 第52-54页 |
第三章 基频特征与动态特征的运用 | 第54-73页 |
·引言 | 第54页 |
·语音信号与基音频率 | 第54-59页 |
·语音信号发声模型 | 第55-57页 |
·Mel域倒谱特征与基音频率 | 第57-59页 |
·基于多相滤波器组的基频检测方法(MPFB-PDA) | 第59-65页 |
·多相滤波器组 | 第59-60页 |
·基频检测 | 第60-63页 |
·清浊音判决 | 第63-64页 |
·基频检测实验结果 | 第64-65页 |
·基频特征与动态特征分析 | 第65-69页 |
·基频统计分布特征 | 第65-67页 |
·一种新的基频/能量轨迹特征(PEC) | 第67-69页 |
·对比实验 | 第69-70页 |
·小结 | 第70-71页 |
参考文献 | 第71-73页 |
第四章 训练数据不足以及噪声下的说话人模型 | 第73-99页 |
·引言 | 第73-74页 |
·混合高斯模型GMM | 第74-79页 |
·GMM模型与实现 | 第74-76页 |
·GMM的机理与不足 | 第76-79页 |
·基于回归类的多特征空间建模方法(RC-MES) | 第79-87页 |
·Eigenvoice方法及其缺陷 | 第80-81页 |
·回归类分析 | 第81-83页 |
·基于回归类的多特征空间算法步骤 | 第83-84页 |
·模型参数估计 | 第84-87页 |
·一种新的噪声与说话人混合建模方法(SBIM) | 第87-93页 |
·一般混合模型描述 | 第88-90页 |
·基于特征空间的混合模型参数估计 | 第90-93页 |
·对比仿真实验 | 第93-96页 |
·训练数据不足时 | 第93-95页 |
·有噪声存在时 | 第95-96页 |
·小结 | 第96-97页 |
参考文献 | 第97-99页 |
第五章 语音传输中的信道补偿 | 第99-121页 |
·引言 | 第99页 |
·说话人识别系统中的传输失真问题 | 第99-102页 |
·语音传输中的失真类型 | 第100-101页 |
·信道失真带来的问题 | 第101-102页 |
·特征域失真补偿技术 | 第102-107页 |
·特征映射 | 第103-105页 |
·改进的特征映射方法(EFM) | 第105-107页 |
·基于RBF的非线性特征映射(RBF-NFM) | 第107-111页 |
·非线性映射与RBF网络 | 第108-109页 |
·RBF网络以及训练策略 | 第109-111页 |
·信道失真补偿实验 | 第111-118页 |
·语音库组成以及失真设置 | 第112-113页 |
·说话人确认实验配置 | 第113页 |
·评价方法与评价指标 | 第113-115页 |
·实验结果及讨论 | 第115-118页 |
·小结 | 第118-119页 |
参考文献 | 第119-121页 |
第六章 总结和展望 | 第121-126页 |
·论文总结 | 第121-124页 |
·不足之处以及进一步的研究方向 | 第124-126页 |
致谢 | 第126-127页 |
附录:攻读博士学位期间所发表的论文 | 第127-128页 |
西北工业大学 学位论文知识产权声明书 | 第128页 |
西北工业大学 学位论文原创性声明 | 第128页 |