首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于文本聚类的微博舆情热点检测技术研究

摘要第5-6页
abstract第6-7页
第1章 绪论第10-16页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-13页
        1.2.1 国内研究现状第11-12页
        1.2.2 国外研究现状第12-13页
    1.3 本文的主要研究内容第13-14页
    1.4 论文结构第14-16页
第2章 话题检测技术分析第16-26页
    2.1 话题检测技术第16-17页
    2.2 中文分词技术第17-19页
    2.3 文本聚类算法第19-25页
        2.3.1 基于划分的聚类算法第20-21页
        2.3.2 基于层次的聚类算法第21-23页
        2.3.3 基于密度的聚类算法第23-24页
        2.3.4 基于网格的聚类算法第24-25页
    2.4 本章小结第25-26页
第3章 微博文本的特征提取与权值计算第26-38页
    3.1 微博数据的预处理第26-28页
        3.1.1 删除噪音数据第26-27页
        3.1.2 中文分词处理第27-28页
        3.1.3 删除停用词第28页
    3.2 文本特征词汇的提取第28-31页
        3.2.1 特征词汇选择方法第28-30页
        3.2.2 提取特征词汇第30-31页
    3.3 微博数据的文本表示第31-33页
    3.4 特征词汇权重计算第33-36页
        3.4.1 词汇权重计算方法第33-34页
        3.4.2 基于TF-IDF的权值计算第34-36页
    3.5 本章小结第36-38页
第4章 微博话题聚类算法研究第38-50页
    4.1 文本的相似度计算第38-39页
    4.2 K-means算法与K-means算法分析第39-43页
        4.2.1 K-means算法第39-41页
        4.2.2 K-means算法分析第41-43页
    4.3 针对微博话题的K-means算法改进第43-47页
        4.3.1 初始聚类中心的选择第43-44页
        4.3.2 聚类中心的选择第44-46页
        4.3.3 基于密度的K-means算法的设计与分析第46-47页
    4.4 微博热点话题提取第47页
    4.5 本章小结第47-50页
第5章 实验结果分析第50-56页
    5.1 测试环境第50-51页
        5.1.1 系统软硬件环境第50页
        5.1.2 实验数据采集与评价标准第50-51页
    5.2 实验内容及结果分析第51-55页
        5.2.1 相似度阈值的选择实验第51-52页
        5.2.2 不同聚类算法比较与分析第52-55页
    5.3 本章小结第55-56页
结论第56-58页
参考文献第58-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:基于盲分离的图像去噪技术研究
下一篇:基于密度树的不确定性数据流聚类算法