摘要 | 第1-8页 |
ABSTRACT | 第8-13页 |
插图索引 | 第13-15页 |
表格索引 | 第15-16页 |
主要缩写对照表 | 第16-18页 |
第一章 绪论 | 第18-32页 |
·研究内容及意义 | 第18-20页 |
·说话人信息应用在多媒体检索中的研究现状 | 第20-28页 |
·说话人信息介绍 | 第20-23页 |
·说话人信息在多媒体检索中的研究进展 | 第23-27页 |
·存在的问题 | 第27-28页 |
·数据库和实验平台 | 第28页 |
·数据库 | 第28页 |
·实验平台 | 第28页 |
·论文主要工作 | 第28-29页 |
·论文章节安排 | 第29-32页 |
第二章 一种改进的BIC 说话人改变检测算法 | 第32-50页 |
·说话人特征介绍 | 第32-36页 |
·美尔频率倒谱系数 | 第33-34页 |
·线性预测系数 | 第34-35页 |
·韵律特征 | 第35-36页 |
·基于BIC 的说话人改变检测算法 | 第36-40页 |
·BIC 原理介绍 | 第36-37页 |
·说话人改变检测介绍 | 第37-38页 |
·基于BIC 的说话人改变检测算法介绍 | 第38-40页 |
·改进的BIC 说话人改变检测算法 | 第40-45页 |
·可测度与检测精度之间的关系 | 第40-41页 |
·在新增区间寻找潜在说话人改变点 | 第41-42页 |
·分析窗长与惩罚因子的关系 | 第42-44页 |
·算法介绍 | 第44-45页 |
·实验及结果分析 | 第45-48页 |
·本章小结 | 第48-50页 |
第三章 一种两步判决的说话人改变检测算法 | 第50-70页 |
·基础知识 | 第50-55页 |
·高斯混合模型 | 第50-54页 |
·基音周期估计 | 第54-55页 |
·MFCC 特征的性别差异分析 | 第55-61页 |
·两步判决的说话人改变检测算法 | 第61-67页 |
·算法思想 | 第61-62页 |
·基频为主、性别模型为辅的说话人改变判决 | 第62-64页 |
·依据性别的改进T2 判决公式的说话人改变判决 | 第64-67页 |
·实验设计与结果 | 第67-68页 |
·本章小结 | 第68-70页 |
第四章 新闻联播故事分割 | 第70-87页 |
·新闻联播故事分割研究进展 | 第70-71页 |
·新闻联播特点 | 第71-73页 |
·结构分析 | 第71-72页 |
·故事类型 | 第72-73页 |
·基于音视频特征的三步判决的故事分割 | 第73-83页 |
·内际音乐检测 | 第74-77页 |
·新闻标题检测 | 第77-78页 |
·镜头改变检测 | 第78-79页 |
·A 类新闻故事的边界检测 | 第79-83页 |
·B 类新闻故事的边界检测 | 第83页 |
·实验分析 | 第83-85页 |
·实验设计 | 第83-84页 |
·实验结果和讨论 | 第84-85页 |
·本章小结 | 第85-87页 |
第五章 多媒体检索中的关键说话人发现 | 第87-102页 |
·基于惩罚距离与GMM 说话人超级矢量的说话人索引 | 第87-94页 |
·GMM 说话人超级矢量 | 第87-88页 |
·说话人索引 | 第88-90页 |
·算法介绍 | 第90-92页 |
·实验分析 | 第92-94页 |
·关键说话人发现 | 第94-100页 |
·关键说话人介绍 | 第94页 |
·基于说话人关键度的关键说话人发现 | 第94-97页 |
·实验分析 | 第97-100页 |
·本章小结 | 第100-102页 |
结论 | 第102-105页 |
研究总结 | 第102-103页 |
后续工作展望 | 第103-105页 |
参考文献 | 第105-113页 |
攻读博士学位期间取得的研究成果 | 第113-114页 |
致谢 | 第114-115页 |