首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网络舆情系统中的热点话题快速发现技术研究

摘要第4-5页
ABSTRACT第5-6页
第一章 引言第9-20页
    1.1 研究的背景、目的和研究意义第9-11页
    1.2 热点话题国内外研究现状第11-14页
    1.3 论文研究内容及本文工作第14-18页
        1.3.1 相似短文本的重复检测第15-16页
        1.3.2 基于短文本的热点话题发现第16-18页
    1.4 论文内容安排第18-20页
第二章 相关理论与关键技术第20-29页
    2.1 话题识别与跟踪评测中的相关技术第20-21页
    2.2 话题发现模型第21-25页
        2.2.1 布尔模型第21页
        2.2.2 向量空间模型第21-22页
        2.2.3 概率模型第22-23页
        2.2.4 语言模型第23-24页
        2.2.5 四种模型比较第24-25页
    2.3 基于文档的话题发现模型及其局限性第25页
    2.4 短文本语言计算和相似性重复检测第25-27页
    2.5 非关系型数据库、TokyoCabinet和TokyoTyrant第27-29页
第三章 基于短文本的相似性重复检测第29-35页
    3.1 基于短文本内容主干的重复分析方法第29页
    3.2 算法实施架构第29-33页
        3.2.1 该架构需要说明之处第30-33页
        3.2.2 该架构中涉及的数据存储第33页
        3.2.3 HASH服务器端结构第33页
        3.2.4 数据处理流程图第33页
    3.3 算法优越性第33-35页
第四章 基于短文本的热点话题发现第35-43页
    4.1 短文本话题发现算法选择第35-36页
    4.2 短文本话题发现模型选择第36页
    4.3 基于突发特征词的聚类方法第36-41页
        4.3.1 短文本预处理第37页
        4.3.2 确认突发词第37-39页
        4.3.3 组合突发词形成事件第39-41页
    4.4 在文本流中检测热点事件第41-43页
第五章 实验研究及结果第43-47页
    5.1 语料的准备及预处理第43-44页
    5.2 确认突发特征词第44-45页
    5.3 识别热点话题第45-46页
    5.4 热点话题粒度分析第46-47页
第六章 短文本舆情分析系统设计第47-53页
    6.1 系统概述第47页
    6.2 系统总体架构设计第47-48页
    6.3 系统业务流程设计第48-49页
    6.4 系统功能设计第49-51页
        6.4.1 信息分析功能组第50-51页
    6.5 系统特点描述第51-53页
        6.5.1 多渠道信息获取第51页
        6.5.2 基于内容相似性去重第51页
        6.5.3 热点话题发现粒度小、质量高第51-53页
第七章 结束语第53-55页
    7.1 本文总结第53-54页
    7.2 进一步工作第54-55页
参考文献第55-59页
致谢第59-60页
攻读学位期间发表的学术论文目录第60页

论文共60页,点击 下载论文
上一篇:朱彝尊《经义考》按语研究
下一篇:基于统计特征的人脸识别系统设计与实现