首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于新浪微博的热点话题发现系统研究与实现

目录第3-6页
摘要第6-7页
Abstract第7页
1 绪论第8-16页
    1.1 研究背景及意义第8-9页
    1.2 国内外研究现状第9-14页
        1.2.1 话题发现与跟踪的相关研究第9-11页
        1.2.2 网络舆情的相关研究第11-13页
        1.2.3 短文本聚类的相关研究第13-14页
    1.3 本文工作及创新点第14页
    1.4 论文结构第14-16页
2 相关技术介绍第16-26页
    2.1 文本聚类技术第16-21页
        2.1.1 聚类概念与聚类过程第16-17页
        2.1.2 文本表示模型第17-18页
        2.1.3 文本相似度第18-19页
        2.1.4 聚类分析算法第19-20页
        2.1.5 K-Means聚类第20页
        2.1.6 BIRCH聚类第20-21页
    2.2 中文自动分词第21-22页
    2.3 微博及网络热点第22-24页
        2.3.1 微博第22-23页
        2.3.2 网络热点第23-24页
    2.4 AJAX技术第24-26页
        2.4.1 AJAX原理第24页
        2.4.2 AJAX应用及优缺点第24-26页
3 微博数据的抓取和预处理第26-32页
    3.1 微博数据的抓取第26-29页
        3.1.1 微博内容的抓取第26-28页
        3.1.2 微博用户信息的抓取第28-29页
    3.2 数据集预处理第29-31页
        3.2.1 微博内容第29-30页
        3.2.2 用户信息第30-31页
    3.3 本章小结第31-32页
4 微博热点发现系统第32-47页
    4.1 系统总体设计思路第32-34页
    4.2 数据结构设计第34-37页
        4.2.1 微博第34-35页
        4.2.2 用户第35-36页
        4.2.3 微话题第36页
        4.2.4 热点第36-37页
    4.3 二次聚类算法设计第37-44页
        4.3.1 聚类前的准备工作第37-38页
        4.3.2 初次聚类-Kmeans聚类第38-41页
        4.3.3 二次聚类-层次聚类BIRCH第41-44页
    4.4 热点排序第44-46页
        4.4.1 热度及用户影响力第44-45页
        4.4.2 微博热度第45页
        4.4.3 微话题热度第45页
        4.4.4 热点热度第45-46页
    4.5 热点展现第46页
    4.6 本章小结第46-47页
5 实验及分析第47-54页
    5.1 实验环境第47页
    5.2 实验过程第47-53页
        5.2.1 微博数据抓取第47-48页
        5.2.2 微博用户第48-49页
        5.2.3 第一次聚类第49-50页
        5.2.4 第二次聚类第50-51页
        5.2.5 热度计算第51-52页
        5.2.6 热点趋势第52-53页
    5.3 实验结果分析第53-54页
6 总结与展望第54-55页
参考文献第55-59页
致谢第59-60页

论文共60页,点击 下载论文
上一篇:基于公共政策议程设置的大众传媒参与机制研究--以无锡报刊亭事件为例
下一篇:航空供应链采购系统的设计与实现