音视频联合说话人定位与跟踪方法研究

摘要	第1-5页
Abstract	第5-9页
1 绪论	第9-23页
·研究背景及意义	第9-10页
·说话人定位与跟踪方法综述	第10-22页
·麦克风阵列声源定位方法	第11-13页
·人脸检测与跟踪方法	第13-18页
·音视频联合说话人定位与跟踪方法	第18-22页
·论文的研究内容	第22-23页
2 粒子滤波理论	第23-43页
·贝叶斯滤波	第23-25页
·粒子滤波	第25-35页
·贝叶斯重要性采样	第26-28页
·序贯重要性采样算法	第28-30页
·重要密度函数的选择	第30-32页
·重采样方法	第32-35页
·量子进化粒子滤波	第35-42页
·量子计算	第36-37页
·量子进化算法	第37-39页
·量子进化粒子滤波算法	第39-40页
·仿真实验	第40-42页
·小结	第42-43页
3 麦克风阵列声源定位与跟踪	第43-73页
·麦克风阵列信号模型	第43-46页
·波束形成定位方法	第46-51页
·延时求和波束形成	第46-49页
·滤波求和波束形成	第49-51页
·基于时延估计的两步声源定位方法	第51-59页
·概述	第51-55页
·基于盲辨识的时延估计方法	第55-59页
·基于空间谱估计的声源定位方法	第59-65页
·信号模型	第59-60页
·宽带加权子空间拟合声源定位	第60-63页
·实验结果与分析	第63-65页
·基于分层采样粒子滤波的麦克风阵列说话人跟踪方法	第65-72页
·语音建立信号的检测	第66-67页
·分层采样粒子滤波在声源跟踪中的应用	第67-69页
·实验结果与分析	第69-72页
·小结	第72-73页
4 基于信息融合的音视频联合说话人跟踪方法	第73-91页
·多传感器信息融合技术	第73-76页
·信息融合的生理学基础	第73-74页
·信息融合的模型与结构	第74-75页
·信息融合的基本方法	第75-76页
·音视频联合说话人跟踪系统基本框架	第76-77页
·说话人跟踪系统中感知方法的实现	第77-83页
·基于麦克风阵列的声源定位方法	第77-79页
·基于肤色的人脸跟踪方法	第79-82页
·基于音视频互信息最大化的说话人跟踪方法	第82-83页
·基于动态贝叶斯网络的音视频联合说话人跟踪	第83-87页
·基于粒子滤波的贝叶斯推理	第84-86页
·基于信息嫡的感知方式管理	第86-87页
·实验结果与分析	第87-90页
·小结	第90-91页
5 基于粒子滤波的语音增强方法	第91-107页
·基于粒子滤波的双模态语音提取方法	第91-98页
·双模态语音提取方法	第92-93页
·音视频互信息计算	第93-94页
·双模态语音提取方法的粒子滤波实现	第94-96页
·实验结果与分析	第96-98页
·基于子带粒子滤波的单通道语音增强方法	第98-106页
·语音信号的时变AR模型	第99-100页
·基于R-B粒子滤波的语音增强方法	第100-102页
·基于子带粒子滤波的语音增强方法	第102-105页
·实验结果与分析	第105-106页
·小结	第106-107页
6 总结与展望	第107-109页
·本文工作总结	第107-108页
·今后研究展望	第108-109页
参考文献	第109-121页
攻读博士学位期间发表学术论文情况	第121-122页
创新点摘要	第122-123页
致谢	第123-124页