音视频联合说话人定位与跟踪方法研究
摘要 | 第1-5页 |
Abstract | 第5-9页 |
1 绪论 | 第9-23页 |
·研究背景及意义 | 第9-10页 |
·说话人定位与跟踪方法综述 | 第10-22页 |
·麦克风阵列声源定位方法 | 第11-13页 |
·人脸检测与跟踪方法 | 第13-18页 |
·音视频联合说话人定位与跟踪方法 | 第18-22页 |
·论文的研究内容 | 第22-23页 |
2 粒子滤波理论 | 第23-43页 |
·贝叶斯滤波 | 第23-25页 |
·粒子滤波 | 第25-35页 |
·贝叶斯重要性采样 | 第26-28页 |
·序贯重要性采样算法 | 第28-30页 |
·重要密度函数的选择 | 第30-32页 |
·重采样方法 | 第32-35页 |
·量子进化粒子滤波 | 第35-42页 |
·量子计算 | 第36-37页 |
·量子进化算法 | 第37-39页 |
·量子进化粒子滤波算法 | 第39-40页 |
·仿真实验 | 第40-42页 |
·小结 | 第42-43页 |
3 麦克风阵列声源定位与跟踪 | 第43-73页 |
·麦克风阵列信号模型 | 第43-46页 |
·波束形成定位方法 | 第46-51页 |
·延时求和波束形成 | 第46-49页 |
·滤波求和波束形成 | 第49-51页 |
·基于时延估计的两步声源定位方法 | 第51-59页 |
·概述 | 第51-55页 |
·基于盲辨识的时延估计方法 | 第55-59页 |
·基于空间谱估计的声源定位方法 | 第59-65页 |
·信号模型 | 第59-60页 |
·宽带加权子空间拟合声源定位 | 第60-63页 |
·实验结果与分析 | 第63-65页 |
·基于分层采样粒子滤波的麦克风阵列说话人跟踪方法 | 第65-72页 |
·语音建立信号的检测 | 第66-67页 |
·分层采样粒子滤波在声源跟踪中的应用 | 第67-69页 |
·实验结果与分析 | 第69-72页 |
·小结 | 第72-73页 |
4 基于信息融合的音视频联合说话人跟踪方法 | 第73-91页 |
·多传感器信息融合技术 | 第73-76页 |
·信息融合的生理学基础 | 第73-74页 |
·信息融合的模型与结构 | 第74-75页 |
·信息融合的基本方法 | 第75-76页 |
·音视频联合说话人跟踪系统基本框架 | 第76-77页 |
·说话人跟踪系统中感知方法的实现 | 第77-83页 |
·基于麦克风阵列的声源定位方法 | 第77-79页 |
·基于肤色的人脸跟踪方法 | 第79-82页 |
·基于音视频互信息最大化的说话人跟踪方法 | 第82-83页 |
·基于动态贝叶斯网络的音视频联合说话人跟踪 | 第83-87页 |
·基于粒子滤波的贝叶斯推理 | 第84-86页 |
·基于信息嫡的感知方式管理 | 第86-87页 |
·实验结果与分析 | 第87-90页 |
·小结 | 第90-91页 |
5 基于粒子滤波的语音增强方法 | 第91-107页 |
·基于粒子滤波的双模态语音提取方法 | 第91-98页 |
·双模态语音提取方法 | 第92-93页 |
·音视频互信息计算 | 第93-94页 |
·双模态语音提取方法的粒子滤波实现 | 第94-96页 |
·实验结果与分析 | 第96-98页 |
·基于子带粒子滤波的单通道语音增强方法 | 第98-106页 |
·语音信号的时变AR模型 | 第99-100页 |
·基于R-B粒子滤波的语音增强方法 | 第100-102页 |
·基于子带粒子滤波的语音增强方法 | 第102-105页 |
·实验结果与分析 | 第105-106页 |
·小结 | 第106-107页 |
6 总结与展望 | 第107-109页 |
·本文工作总结 | 第107-108页 |
·今后研究展望 | 第108-109页 |
参考文献 | 第109-121页 |
攻读博士学位期间发表学术论文情况 | 第121-122页 |
创新点摘要 | 第122-123页 |
致谢 | 第123-124页 |