首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Single-Pass聚类算法的改进及其在微博话题检测中的应用研究

摘要第6-7页
Abstract第7页
第一章 绪论第8-12页
    1.1 研究背景及意义第8-9页
    1.2 国内外研究现状第9-11页
    1.3 论文组织结构第11-12页
第二章 微博相关概述及微博数据的获取第12-24页
    2.1 微博相关研究第12-16页
        2.1.1 微博概述第12-13页
        2.1.2 微博信息特点第13-14页
        2.1.3 微博传播特点第14-16页
    2.2 基于网络爬虫的网络信息获取第16-18页
        2.2.1 网络爬虫的基本框架第16-17页
        2.2.2 网络爬虫的搜索策略第17-18页
        2.2.3 基于网络爬虫的微博数据获取第18页
    2.3 基于新浪微博API的数据获取第18-23页
        2.3.1 新浪微博API概述第18-19页
        2.3.2 OAuth2.0 用户身份认证第19-22页
        2.3.3 基于新浪微博API的数据获取流程第22-23页
    2.4 本章小结第23-24页
第三章 改进的Single-Pass算法在微博话题检测中的应用研究第24-37页
    3.1 话题检测的具体流程第24页
    3.2 微博数据预处理第24-26页
        3.2.1 过滤噪声信息第24-25页
        3.2.2 分词及词性标注第25页
        3.2.3 去除停用词第25-26页
    3.3 微博文本建模第26-29页
        3.3.1 文本表示第26-27页
        3.3.2 文本特征提取第27-29页
        3.3.3 特征项权重第29页
    3.4 文本相似度计算第29-30页
    3.5 改进的Single-Pass聚类算法第30-36页
        3.5.1 文本聚类算法介绍及Single-Pass算法的改进第30-34页
        3.5.2 实验数据与评价指标第34-35页
        3.5.3 实验结果与分析第35-36页
    3.6 本章小结第36-37页
第四章 微博话题检测系统的设计与实现第37-45页
    4.1 微博话题检测系统的设计第37-41页
        4.1.1 微博话题检测系统框架第37-38页
        4.1.2 数据库的设计第38-41页
    4.2 微博话题检测系统的实现第41-44页
        4.2.1 系统运行环境第41-42页
        4.2.2 系统各功能模块的实现第42-44页
    4.3 本章小结第44-45页
第五章 结论第45-47页
参考文献第47-51页
致谢第51页

论文共51页,点击 下载论文
上一篇:JAVA在ERP及移动终端的开发应用
下一篇:基于水平集的非匀质医学图像分割算法研究