音视频联合说话人定位与跟踪方法研究
| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 1 绪论 | 第9-23页 |
| ·研究背景及意义 | 第9-10页 |
| ·说话人定位与跟踪方法综述 | 第10-22页 |
| ·麦克风阵列声源定位方法 | 第11-13页 |
| ·人脸检测与跟踪方法 | 第13-18页 |
| ·音视频联合说话人定位与跟踪方法 | 第18-22页 |
| ·论文的研究内容 | 第22-23页 |
| 2 粒子滤波理论 | 第23-43页 |
| ·贝叶斯滤波 | 第23-25页 |
| ·粒子滤波 | 第25-35页 |
| ·贝叶斯重要性采样 | 第26-28页 |
| ·序贯重要性采样算法 | 第28-30页 |
| ·重要密度函数的选择 | 第30-32页 |
| ·重采样方法 | 第32-35页 |
| ·量子进化粒子滤波 | 第35-42页 |
| ·量子计算 | 第36-37页 |
| ·量子进化算法 | 第37-39页 |
| ·量子进化粒子滤波算法 | 第39-40页 |
| ·仿真实验 | 第40-42页 |
| ·小结 | 第42-43页 |
| 3 麦克风阵列声源定位与跟踪 | 第43-73页 |
| ·麦克风阵列信号模型 | 第43-46页 |
| ·波束形成定位方法 | 第46-51页 |
| ·延时求和波束形成 | 第46-49页 |
| ·滤波求和波束形成 | 第49-51页 |
| ·基于时延估计的两步声源定位方法 | 第51-59页 |
| ·概述 | 第51-55页 |
| ·基于盲辨识的时延估计方法 | 第55-59页 |
| ·基于空间谱估计的声源定位方法 | 第59-65页 |
| ·信号模型 | 第59-60页 |
| ·宽带加权子空间拟合声源定位 | 第60-63页 |
| ·实验结果与分析 | 第63-65页 |
| ·基于分层采样粒子滤波的麦克风阵列说话人跟踪方法 | 第65-72页 |
| ·语音建立信号的检测 | 第66-67页 |
| ·分层采样粒子滤波在声源跟踪中的应用 | 第67-69页 |
| ·实验结果与分析 | 第69-72页 |
| ·小结 | 第72-73页 |
| 4 基于信息融合的音视频联合说话人跟踪方法 | 第73-91页 |
| ·多传感器信息融合技术 | 第73-76页 |
| ·信息融合的生理学基础 | 第73-74页 |
| ·信息融合的模型与结构 | 第74-75页 |
| ·信息融合的基本方法 | 第75-76页 |
| ·音视频联合说话人跟踪系统基本框架 | 第76-77页 |
| ·说话人跟踪系统中感知方法的实现 | 第77-83页 |
| ·基于麦克风阵列的声源定位方法 | 第77-79页 |
| ·基于肤色的人脸跟踪方法 | 第79-82页 |
| ·基于音视频互信息最大化的说话人跟踪方法 | 第82-83页 |
| ·基于动态贝叶斯网络的音视频联合说话人跟踪 | 第83-87页 |
| ·基于粒子滤波的贝叶斯推理 | 第84-86页 |
| ·基于信息嫡的感知方式管理 | 第86-87页 |
| ·实验结果与分析 | 第87-90页 |
| ·小结 | 第90-91页 |
| 5 基于粒子滤波的语音增强方法 | 第91-107页 |
| ·基于粒子滤波的双模态语音提取方法 | 第91-98页 |
| ·双模态语音提取方法 | 第92-93页 |
| ·音视频互信息计算 | 第93-94页 |
| ·双模态语音提取方法的粒子滤波实现 | 第94-96页 |
| ·实验结果与分析 | 第96-98页 |
| ·基于子带粒子滤波的单通道语音增强方法 | 第98-106页 |
| ·语音信号的时变AR模型 | 第99-100页 |
| ·基于R-B粒子滤波的语音增强方法 | 第100-102页 |
| ·基于子带粒子滤波的语音增强方法 | 第102-105页 |
| ·实验结果与分析 | 第105-106页 |
| ·小结 | 第106-107页 |
| 6 总结与展望 | 第107-109页 |
| ·本文工作总结 | 第107-108页 |
| ·今后研究展望 | 第108-109页 |
| 参考文献 | 第109-121页 |
| 攻读博士学位期间发表学术论文情况 | 第121-122页 |
| 创新点摘要 | 第122-123页 |
| 致谢 | 第123-124页 |