基于web的普通话新闻检索技术研究

摘要	第5-6页
ABSTRACT	第6-7页
第一章绪论	第11-20页
1.1 研究背景与意义	第11-12页
1.2 国内外研究现状	第12-18页
1.2.1 音频信息检索技术的分类	第12-13页
1.2.2 音频样例检索	第13-14页
1.2.3 语音文档检索	第14-18页
1.2.3.1 语音识别的发展与现状	第14-15页
1.2.3.2 语音文档检索的发展与现状	第15-17页
1.2.3.3 普通话新闻语音文档检索中的特殊问题	第17-18页
1.3 本文的主要研究内容	第18页
1.4 本文的章节安排	第18-20页
第二章普通话新闻检索基础	第20-29页
2.1 音视频的数字化表示	第20-21页
2.2 音频检索中的特征提取与模型	第21-27页
2.2.1 音频信号的预处理	第21-22页
2.2.2 声学特征提取	第22-24页
2.2.3 常用模型	第24-27页
2.2.3.1 隐马尔科夫模型	第24-25页
2.2.3.2 高斯混合模型	第25-27页
2.3 普通话新闻检索系统的原理框架及实验语料的采集	第27-28页
2.3.1 普通话新闻检索系统的原理框架	第27页
2.3.2 实验语料的采集	第27-28页
2.4 普通话新闻检索系统的评价指标	第28页
2.5 本章小结	第28-29页
第三章基于样例的普通话新闻检索算法	第29-47页
3.1 概述	第29-30页
3.2 基于语谱图的音频指纹特征提取	第30-34页
3.3 基于倒排索引的检索算法及其改进	第34-41页
3.3.1 基于倒排索引的检索算法	第34-38页
3.3.2 检索算法的改进	第38-41页
3.4 实验及结果分析	第41-46页
3.4.1 实验数据	第41-42页
3.4.2 结果与分析	第42-46页
3.4.2.1 不同样例时长对检索性能的影响	第42-44页
3.4.2.2 检索系统鲁棒性	第44-45页
3.4.2.3 SAD算法对检索系统的改进	第45-46页
3.5 本章小结	第46-47页
第四章基于大词汇量连续语音识别的普通话新闻检索算法	第47-76页
4.1 概述	第47-48页
4.2 文本无关的新闻故事分割算法设计	第48-58页
4.2.1 新闻音频分类	第49-50页
4.2.2 两步新闻音频分割	第50-53页
4.2.2.1 基于距离的说话人分割	第50-52页
4.2.2.2 说话人分层聚类	第52页
4.2.2.3 重分割	第52-53页
4.2.3 基于GMM-UBM的说话人确认	第53-56页
4.2.4 新闻故事分割算法实现	第56-58页
4.3 面向检索的大词汇量连续语音识别（LVCSR）系统	第58-62页
4.3.1 语音识别原理	第58-59页
4.3.2 LVCSR系统的前端处理算法实现	第59-60页
4.3.3 LVCSR系统构建	第60-62页
4.4 基于LVCSR的普通话新闻检索中的检索算法	第62-66页
4.4.1 基于Lucene的全文检索	第62-64页
4.4.1.1 Lucene简介	第62页
4.4.1.2 中文分词	第62-63页
4.4.1.3 索引建立	第63-64页
4.4.1.4 搜索算法	第64页
4.4.2 基于词向量的相关检索词推荐	第64-66页
4.5 实验及结果分析	第66-75页
4.5.1 实验数据	第66-67页
4.5.2 结果与分析	第67-75页
4.5.2.1 新闻音频分类算法评价	第67-68页
4.5.2.2 两步新闻音频分割算法性能	第68-69页
4.5.2.3 基于GMM-UBM的说话人确认算法的错误率	第69-71页
4.5.2.4 文本无关的新闻故事分割算法实验	第71-72页
4.5.2.5 LVCSR系统的识别率	第72-73页
4.5.2.6 基于LVCSR的普通话新闻检索算法的检索性能	第73-75页
4.5.2.7 基于词向量的相关检索词推荐算法评估	第75页
4.6 本章小结	第75-76页
第五章普通话新闻检索系统设计与实现	第76-85页
5.1 概述	第76-77页
5.2 普通话新闻检索系统主检索页面设计与实现	第77页
5.3 基于样例的普通话新闻检索子系统设计与实现	第77-80页
5.3.1 系统功能描述	第77页
5.3.2 系统设计	第77-78页
5.3.3 系统实现与特点	第78-80页
5.4 基于LVCSR的普通话新闻检索子系统设计与实现	第80-84页
5.4.1 系统功能描述	第80-81页
5.4.2 系统设计	第81页
5.4.3 系统实现与特点	第81-84页
5.5 本章小结	第84-85页
第六章总结与展望	第85-87页
6.1 本文工作总结	第85-86页
6.2 未来工作展望	第86-87页
致谢	第87-88页
参考文献	第88-93页
攻硕期间取得的研究成果	第93-94页