首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

网络热点话题检测与趋势预测技术研究

摘要第4-5页
Abstract第5页
第一章 绪论第9-16页
    1.1 研究背景及意义第9-10页
    1.2 国内外研究现状第10-13页
        1.2.1 话题检测与跟踪技术研究现状第10-12页
        1.2.2 话题趋势分析预测技术研究现状第12-13页
    1.3 论文的研究内容第13-14页
        1.3.1 研究目标第13-14页
        1.3.2 研究内容第14页
    1.4 论文结构第14-16页
第二章 相关工作第16-24页
    2.1 文本预处理第16-17页
        2.1.1 中文分词第16-17页
        2.1.2 过滤停用词第17页
    2.2 文本表示模型第17-19页
        2.2.1 向量空间模型第17-18页
        2.2.2 语言模型第18页
        2.2.3 概率主题模型第18-19页
    2.3 文本特征提取第19-21页
        2.3.1 特征提取第19-21页
        2.3.2 相似度计算第21页
    2.4 聚类算法第21-23页
        2.4.1 层次聚类算法第22页
        2.4.2 基于划分的聚类算法第22-23页
        2.4.3 增量聚类算法第23页
    2.5 本章小结第23-24页
第三章 热点话题检测与话题热度建模第24-38页
    3.1 概述第24-26页
        3.1.1 热点话题的特征第24页
        3.1.2 话题的热度第24-25页
        3.1.3 本章工作概述第25-26页
    3.2 数据获取与预处理第26-28页
        3.2.1 定制网络爬虫第26-27页
        3.2.2 中文分词第27页
        3.2.3 其他预处理第27-28页
    3.3 特征提取第28-30页
        3.3.1 增量TF-IDF第28-29页
        3.3.2 以标题为轴心的增量TF-IDF第29-30页
        3.3.3 相似度计算第30页
    3.4 基于分段时间线与Single-pass的二次聚类算法第30-33页
    3.5 基于生命周期模型的话题热度建模算法第33-38页
        3.5.1 生命周期理论第33-34页
        3.5.2 生命周期模型定义与说明第34-36页
        3.5.3 话题热度建模算法第36-38页
第四章 话题热度趋势分析第38-42页
    4.1 概述第38页
    4.2 移动平均线模型第38-40页
    4.3 热度趋势分析第40-42页
第五章 实验第42-48页
    5.1 话题检测第42-46页
        5.1.1 数据来源第42页
        5.1.2 评估标准第42-43页
        5.1.3 最优时间距离选取第43-44页
        5.1.4 聚类结果比较第44-45页
        5.1.5 时间效率对比第45-46页
    5.2 热度模型构建的合理性分析第46-47页
    5.3 话题热度趋势预测第47-48页
第六章 总结与展望第48-50页
    6.1 本文工作总结第48页
    6.2 不足之处第48-49页
    6.3 展望第49-50页
参考文献第50-54页
发表论文和参加科研情况说明第54-55页
致谢第55-56页

论文共56页,点击 下载论文
上一篇:晚清科技文献官方、民间、宗教三大作者群体研究
下一篇:大气激光通信调制解调技术的研究