首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于web的普通话新闻检索技术研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-20页
    1.1 研究背景与意义第11-12页
    1.2 国内外研究现状第12-18页
        1.2.1 音频信息检索技术的分类第12-13页
        1.2.2 音频样例检索第13-14页
        1.2.3 语音文档检索第14-18页
            1.2.3.1 语音识别的发展与现状第14-15页
            1.2.3.2 语音文档检索的发展与现状第15-17页
            1.2.3.3 普通话新闻语音文档检索中的特殊问题第17-18页
    1.3 本文的主要研究内容第18页
    1.4 本文的章节安排第18-20页
第二章 普通话新闻检索基础第20-29页
    2.1 音视频的数字化表示第20-21页
    2.2 音频检索中的特征提取与模型第21-27页
        2.2.1 音频信号的预处理第21-22页
        2.2.2 声学特征提取第22-24页
        2.2.3 常用模型第24-27页
            2.2.3.1 隐马尔科夫模型第24-25页
            2.2.3.2 高斯混合模型第25-27页
    2.3 普通话新闻检索系统的原理框架及实验语料的采集第27-28页
        2.3.1 普通话新闻检索系统的原理框架第27页
        2.3.2 实验语料的采集第27-28页
    2.4 普通话新闻检索系统的评价指标第28页
    2.5 本章小结第28-29页
第三章 基于样例的普通话新闻检索算法第29-47页
    3.1 概述第29-30页
    3.2 基于语谱图的音频指纹特征提取第30-34页
    3.3 基于倒排索引的检索算法及其改进第34-41页
        3.3.1 基于倒排索引的检索算法第34-38页
        3.3.2 检索算法的改进第38-41页
    3.4 实验及结果分析第41-46页
        3.4.1 实验数据第41-42页
        3.4.2 结果与分析第42-46页
            3.4.2.1 不同样例时长对检索性能的影响第42-44页
            3.4.2.2 检索系统鲁棒性第44-45页
            3.4.2.3 SAD算法对检索系统的改进第45-46页
    3.5 本章小结第46-47页
第四章 基于大词汇量连续语音识别的普通话新闻检索算法第47-76页
    4.1 概述第47-48页
    4.2 文本无关的新闻故事分割算法设计第48-58页
        4.2.1 新闻音频分类第49-50页
        4.2.2 两步新闻音频分割第50-53页
            4.2.2.1 基于距离的说话人分割第50-52页
            4.2.2.2 说话人分层聚类第52页
            4.2.2.3 重分割第52-53页
        4.2.3 基于GMM-UBM的说话人确认第53-56页
        4.2.4 新闻故事分割算法实现第56-58页
    4.3 面向检索的大词汇量连续语音识别(LVCSR)系统第58-62页
        4.3.1 语音识别原理第58-59页
        4.3.2 LVCSR系统的前端处理算法实现第59-60页
        4.3.3 LVCSR系统构建第60-62页
    4.4 基于LVCSR的普通话新闻检索中的检索算法第62-66页
        4.4.1 基于Lucene的全文检索第62-64页
            4.4.1.1 Lucene简介第62页
            4.4.1.2 中文分词第62-63页
            4.4.1.3 索引建立第63-64页
            4.4.1.4 搜索算法第64页
        4.4.2 基于词向量的相关检索词推荐第64-66页
    4.5 实验及结果分析第66-75页
        4.5.1 实验数据第66-67页
        4.5.2 结果与分析第67-75页
            4.5.2.1 新闻音频分类算法评价第67-68页
            4.5.2.2 两步新闻音频分割算法性能第68-69页
            4.5.2.3 基于GMM-UBM的说话人确认算法的错误率第69-71页
            4.5.2.4 文本无关的新闻故事分割算法实验第71-72页
            4.5.2.5 LVCSR系统的识别率第72-73页
            4.5.2.6 基于LVCSR的普通话新闻检索算法的检索性能第73-75页
            4.5.2.7 基于词向量的相关检索词推荐算法评估第75页
    4.6 本章小结第75-76页
第五章 普通话新闻检索系统设计与实现第76-85页
    5.1 概述第76-77页
    5.2 普通话新闻检索系统主检索页面设计与实现第77页
    5.3 基于样例的普通话新闻检索子系统设计与实现第77-80页
        5.3.1 系统功能描述第77页
        5.3.2 系统设计第77-78页
        5.3.3 系统实现与特点第78-80页
    5.4 基于LVCSR的普通话新闻检索子系统设计与实现第80-84页
        5.4.1 系统功能描述第80-81页
        5.4.2 系统设计第81页
        5.4.3 系统实现与特点第81-84页
    5.5 本章小结第84-85页
第六章 总结与展望第85-87页
    6.1 本文工作总结第85-86页
    6.2 未来工作展望第86-87页
致谢第87-88页
参考文献第88-93页
攻硕期间取得的研究成果第93-94页

论文共94页,点击 下载论文
上一篇:多载波定向水声通信系统均衡器的设计与实现
下一篇:复杂电磁环境下基于目标动特性的微波成像技术