基于文本无关的说话人识别技术研究
摘要 | 第1-4页 |
Abstract | 第4-8页 |
1 绪论 | 第8-14页 |
·背景及意义 | 第8-9页 |
·应用领域 | 第9页 |
·说话人识别技术的发展与现状 | 第9-11页 |
·说话人识别技术研究重点及难点 | 第11-12页 |
·研究工作概述与安排 | 第12-14页 |
·工作内容 | 第12页 |
·论文的组织结构 | 第12-14页 |
2 说话人识别的基本理论 | 第14-23页 |
·引言 | 第14页 |
·说话人识别的分类 | 第14-15页 |
·说话人识别原理与系统结构 | 第15-17页 |
·说话人识别中的识别方法 | 第17-19页 |
·模板匹配法 | 第17页 |
·统计概率模型法 | 第17-18页 |
·人工神经网络 | 第18-19页 |
·支持向量机 | 第19页 |
·性能评价 | 第19-20页 |
·WAV声音文件格式剖析 | 第20-22页 |
·RIFF文件与WAV文件 | 第21页 |
·WAV文件头 | 第21-22页 |
·小结 | 第22-23页 |
3 语音信号预处理及相关技术 | 第23-30页 |
·引言 | 第23页 |
·语音信号的数字化 | 第23-24页 |
·预加重 | 第24-25页 |
·分帧 | 第25页 |
·加窗 | 第25-26页 |
·语音信号的时域分析 | 第26-27页 |
·短时能量 | 第26-27页 |
·短时平均过零率 | 第27页 |
·短时自相关函数 | 第27页 |
·端点检测 | 第27-29页 |
·其于短时能量或短时平均幅度的检测方法 | 第28页 |
·其于短时能量和短时平均过零率的检测方法 | 第28页 |
·频带方差检测法 | 第28-29页 |
·小结 | 第29-30页 |
4 语音信号的特征参数提取 | 第30-39页 |
·引言 | 第30-31页 |
·语音信号的线性预测分析 | 第31-33页 |
·线性预测的基本原理 | 第31-33页 |
·线性预测系数的求取 | 第33-35页 |
·自相关法 | 第33-35页 |
·LPC模型阶数的确定 | 第35页 |
·线性预测倒谱系数的求取 | 第35-36页 |
·MFCC参数原理与提取 | 第36-38页 |
·MFCC参数的提取过程 | 第37-38页 |
·MFCC参数的优点 | 第38页 |
·小结 | 第38-39页 |
5 说话人识别的模型 | 第39-56页 |
·引言 | 第39页 |
·矢量量化方法 | 第39-45页 |
·矢量量化的基本原理 | 第40页 |
·矢量量化的关键问题 | 第40-41页 |
·矢量的失真描述 | 第41-42页 |
·VQ在说话人识别中的应用 | 第42-43页 |
·矢量量化中的码本设计 | 第43-45页 |
·隐马尔可夫模型方法 | 第45-48页 |
·HMM基本思想 | 第45-46页 |
·HMM定义 | 第46-47页 |
·HMM的结构 | 第47页 |
·HMM的类型 | 第47-48页 |
·HMM的三个基本问题 | 第48页 |
·HMM在说话人识别中的应用 | 第48页 |
·高斯混合模型方法 | 第48-55页 |
·GMM基本概念 | 第49页 |
·GMM的训练 | 第49-53页 |
·GMM的识别算法 | 第53-54页 |
·GMM在说话人识别中的应用 | 第54-55页 |
·小结 | 第55-56页 |
6 说话人识别系统的实现和实验数据 | 第56-72页 |
·引言 | 第56页 |
·说话人识别系统说明 | 第56-61页 |
·系统开发和运行环境 | 第56页 |
·系统主要功能介绍 | 第56-57页 |
·系统模块介绍 | 第57-61页 |
·基于GMM模型的说话人识别系统的性能研究 | 第61-69页 |
·语音信号的预处理 | 第61页 |
·数据采集 | 第61页 |
·语音库构成 | 第61页 |
·说话人辨认实验结果与分析 | 第61-68页 |
·说话人确认实验结果与分析 | 第68-69页 |
·基于VQ的说话人识别系统的性能研究 | 第69-72页 |
·说话人辨认实验结果与分析 | 第69-72页 |
7 总结与展望 | 第72-74页 |
·本文工作总结 | 第72-73页 |
·展望 | 第73-74页 |
致谢 | 第74-75页 |
参考文献 | 第75-78页 |