基于Kinect的特定说话人跟踪系统的研究与实现

摘要	第7-8页
Abstract	第8-9页
第1章绪论	第14-19页
1.1 研究目的和意义	第14页
1.2 说话人跟踪的研究现状	第14-17页
1.2.1 说话人识别与确认的研究现状	第15-16页
1.2.2 说话人定位与跟踪技术的研究现状	第16-17页
1.3 研究内容与主要工作	第17-18页
1.4 本文结构	第18-19页
第2章特定说话人跟踪的理论基础	第19-35页
2.1 引言	第19页
2.2 说话人声纹特征的提取	第19-23页
2.2.1 说话人识别框架	第19-20页
2.2.2 语音信号的前期处理	第20-21页
2.2.3 特征参数MFCC的提取	第21-23页
2.3 基于GMM-UBM模型的说话人确认	第23-29页
2.3.1 UBM的参数估计	第24-26页
2.3.2 MAP算法	第26-28页
2.3.3 GMM-UBM对数似然比	第28-29页
2.4 Kinect自适应波束形成的声源定位方法	第29-34页
2.4.1 Kinect简介	第29-30页
2.4.2 近场模型	第30-31页
2.4.3 噪声、混响环境下的信号模型	第31页
2.4.4 自适应波束形成(MVDR)算法	第31-34页
2.5 本章小结	第34-35页
第3章基于Kinect的特定说话人跟踪系统的设计	第35-43页
3.1 引言	第35页
3.2 系统的总体设计与目标	第35-39页
3.2.1 功能需求分析	第35-37页
3.2.2 性能指标	第37-39页
3.3 系统的模块设计	第39-42页
3.3.1 音频采集与处理模块	第39-40页
3.3.2 说话人确认模块	第40-41页
3.3.3 定位跟踪模块	第41-42页
3.4 本章小结	第42-43页
第4章系统实现及测试结果分析	第43-53页
4.1 引言	第43页
4.2 基于声纹特征的说话人确认	第43-44页
4.3 说话人的定位和跟踪	第44-51页
4.3.1 单一说话人的定位跟踪	第44-48页
4.3.2 多说话人中特定说话人的定位跟踪	第48-50页
4.3.3 混响、噪声环境下特定说话人的定位跟踪	第50-51页
4.4 本章小结	第51-53页
结论	第53-54页
参考文献	第54-58页
攻读硕士学位期间发表的论文	第58-59页
致谢	第59页