首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于改进H-K聚类算法的热点话题发现方法

摘要第5-6页
Abstract第6-7页
第1章 绪论第10-16页
    1.1 研究背景和意义第10-11页
    1.2 国内外研究现状第11-13页
    1.3 研究内容及目标第13-14页
    1.4 论文的组织结构第14-16页
第2章 相关理论和主要技术第16-28页
    2.1 微博相关理论第16-17页
        2.1.1 微博客概述第16页
        2.1.2 微博客特点第16-17页
        2.1.3 微博客传播特点第17页
    2.2 文本挖掘第17-23页
        2.2.1 文本挖掘概述第17-18页
        2.2.2 文本聚类算法第18-21页
        2.2.3 文本表示模型第21-22页
        2.2.4 文本间相似度计算第22-23页
    2.3 云计算与Hadoop技术第23-26页
        2.3.1 云计算概述第23-24页
        2.3.2 Hadoop的概述与应用第24页
        2.3.3 Hadoop的文件系统第24-25页
        2.3.4 Hadoop的MapReduce编程思想第25-26页
    2.4 本章小结第26-28页
第3章 基于改进H-K聚类算法的微博客热点话题发现第28-48页
    3.1 H-K聚类算法的分析及改进第28-33页
        3.1.1 改进的H-K聚类算法的主要思想及分析第28-30页
        3.1.2 改进的H-K聚类算法的描述第30-32页
        3.1.3 改进的H-K聚类算法的性能分析第32-33页
    3.2 基于改进H-K聚类算法的微博客的热点话题发现的基本思想第33-34页
    3.3 微博客数据集的采集第34-35页
    3.4 微博客数据集的预处理第35-37页
        3.4.1 去除数据集无用的信息第35-36页
        3.4.2 微博客的中文分词第36-37页
        3.4.3 微博客数据的停用词处理第37页
    3.5 LDA主题模型建模第37-42页
        3.5.1 主题模型的引出第37-39页
        3.5.2 LDA建模第39-42页
    3.6 微博客的热点话题发现第42-46页
        3.6.1 基于H-K聚类算法的微博客话题发现第42-44页
        3.6.2 热点话题的选取第44-46页
    3.7 本章小结第46-48页
第4章 实验及结果分析第48-58页
    4.1 实验环境与工具第48页
    4.2 实验数据第48-49页
    4.3 实验评价方法第49-50页
        4.3.1 聚类性能评价第49-50页
        4.3.2 主题模型的性能评价指标第50页
    4.4 实验内容及结果分析第50-57页
        4.4.1 参数敏感度测试第51-53页
        4.4.2 对比试验第53-55页
        4.4.3 热点话题的发现第55-57页
    4.5 本章小结第57-58页
结论第58-60页
参考文献第60-64页
攻读硕士学位期间发表的论文和取得的科研成果第64-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:产业结构转型背景下土地集约利用优化研究--以南京为例
下一篇:高校马克思主义生态文明思想教育研究