首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于论坛的热点话题识别与趋势预测研究

摘要第2-4页
Abstract第4-5页
第1章 绪论第8-12页
    1.1 研究背景及意义第8页
    1.2 国内外现状第8-10页
        1.2.1 话题检测第9-10页
        1.2.2 话题预测分析第10页
    1.3 本文研究内容第10-11页
    1.4 论文组织结构第11-12页
第2章 相关技术及原理第12-26页
    2.1 论坛数据的采集与处理第12-17页
        2.1.1 爬虫的概念第12页
        2.1.2 原理第12-14页
        2.1.3 关键部分第14-17页
    2.2 热点话题检测第17-24页
        2.2.1 热点话题的描述第18页
        2.2.2 文本表示模型第18-19页
        2.2.3 文本特征提取第19-22页
        2.2.4 文本相似度计算第22-23页
        2.2.5 文本聚类第23-24页
    2.3 本章小结第24-26页
第3章 热点话题识别第26-39页
    3.1 文本预处理第26-29页
        3.1.1 中文分词第26-27页
        3.1.2 停用词的处理第27-28页
        3.1.3 特征提取第28-29页
    3.2 热点话题检测第29-35页
        3.2.1 多向量表示模型第29-30页
        3.2.2 相似度计算第30-32页
        3.2.3 基于二次聚类的话题检测第32-35页
    3.3 实验及结果分析第35-38页
        3.3.1 实验环境第35页
        3.3.2 实验数据第35-36页
        3.3.3 评判标准第36-37页
        3.3.4 结果分析第37-38页
    3.4 本章小结第38-39页
第4章 热点话题的预测分析第39-49页
    4.1 ARIMA模型第39-44页
        4.1.1 ARIMA模型介绍第39-40页
        4.1.2 建模步骤第40-41页
        4.1.3 模型识别和参数估计第41-42页
        4.1.4 模型的检验第42-43页
        4.1.5 模型预测第43-44页
    4.2 实验结果分析第44-48页
        4.2.1 实验环境第44页
        4.2.2 实验数据第44页
        4.2.3 实验步骤以及分析第44-48页
    4.3 本章小结第48-49页
第5章 结论与展望第49-51页
    5.1 总结第49-50页
    5.2 进一步工作的方向第50-51页
参考文献第51-53页
致谢第53-55页
附件第55页

论文共55页,点击 下载论文
上一篇:上海嘉定某项目开发成本控制研究
下一篇:前突厥汗国分裂与灭亡问题探微