首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

短文本主题分析的相关问题研究

摘要第4-5页
ABSTRACT第5页
目录第6-8页
第一章 绪论第8-12页
    1.1 课题研究背景第8-9页
    1.2 国内外研究现状第9页
    1.3 研究内容及本文创新点第9-10页
    1.4 论文结构第10-12页
第二章 文本主题分析技术第12-23页
    2.1 自然语言处理基本问题介绍第12-17页
        2.1.1 分词技术第12-14页
        2.1.2 文本表示模型第14-16页
        2.1.3 文本相似度计算第16-17页
    2.2 话题发现技术介绍第17-21页
        2.2.1 聚类算法第17-19页
        2.2.2 LDA主题模型第19-21页
    2.3 传统BM25算法简介第21-23页
第三章 基于改进的BM25算法的热点话题发现算法第23-34页
    3.1 话题词-BM25相似度算法第23-25页
    3.2 基于话题词-BM25相似度的聚类算法第25-28页
        3.2.1 核心话题词的选择第27-28页
        3.2.2 话题词-BM25算法介绍第28页
    3.3 基于话题词-BM25算法的话题发现实验及效果分析第28-32页
        3.3.1 相关实验介绍第29-30页
        3.3.2 实验过程第30页
        3.3.3 效果分析第30-32页
        3.3.4 算法复杂度分析第32页
    3.4 本章小结第32-34页
第四章 基于LDA-BM25算法的话题发现算法第34-46页
    4.1 LDA主题模型对比实验第34-38页
        4.1.1 基于LDA主题模型的话题发现算法实验第34-36页
        4.1.2 基于LDA主题模型的话题发现算法优缺点分析第36-38页
    4.2 LDA-BM25话题发现算法第38-42页
        4.2.1 LDA-BM25话题发现算法设计第38-39页
        4.2.2 LDA-BM25算法实验及效果分析第39-42页
        4.2.3 LDA-BM25算法性能分析第42页
    4.3 话题词-BM25算法与LDA-BM25算法的人工标注对比第42-45页
        4.3.1 实验方法第42-43页
        4.3.2 实验结果及分析第43-45页
    4.4 本章小结第45-46页
第五章 基于海量短文本主题分析的分布式处理第46-62页
    5.1 短文本预处理第46-50页
        5.1.1 短文本清洗技术第47-49页
        5.1.2 针对特定语料的特殊处理第49-50页
        5.1.3 短文本分词技术第50页
    5.2 基于海量短文本流的分布式预处理第50-57页
        5.2.1 分布式流式处理系统设计第51-53页
        5.2.2 基于异步索引机制的海量短文本分布式存储技术第53-55页
        5.2.3 分布式流处理系统性能第55-57页
    5.3 基于海量短文本的话题发现系统设计第57-60页
        5.3.1 高效话题发现设计第57-58页
        5.3.2 时间乱序短文本处理方法与系统设计第58-59页
        5.3.3 基于海量短文本的话题发现系统性能第59-60页
    5.4 海量短文本系统架构图第60-61页
    5.5 本章小结第61-62页
第六章 总结与展望第62-64页
    6.1 全文总结第62页
    6.2 未来展望第62-64页
参考文献第64-67页
致谢第67-68页
攻读学位期间发表的学术论文目录第68页

论文共68页,点击 下载论文
上一篇:实体连接(Entity Linking)关键问题的研究与实现
下一篇:实体关系抽取技术研究