首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于微博的热点话题检测

摘要第3-4页
Abstract第4页
第一章 引言第7-12页
    1.1 研究的背景及意义第7-8页
    1.2 研究的现状第8-9页
    1.3 本文研究的内容第9-12页
第二章 微博特征分析及微博数据采集第12-27页
    2.1 微博特点分析第12-16页
        2.1.1 微博概述第12-13页
        2.1.2 微博的信息特点第13-14页
        2.1.3 微博的传播特点第14-16页
    2.2 基于新浪微博APJ的数据获取第16-19页
        2.2.1 OAUTH认证第16-17页
        2.2.2 新浪微博API第17-19页
    2.3 基于网络爬虫的微博数据获取第19-24页
        2.3.1 微博爬虫的模型框架第19页
        2.3.2 网络爬虫的搜索策略第19-21页
        2.3.3 新浪微博模拟登陆第21-23页
        2.3.4 新浪微博内容抓取第23-24页
    2.4 TDT相关知识第24-27页
        2.4.1 TDT的研究方向第24页
        2.4.2 TDT的主要任务第24-25页
        2.4.3 TDT的评测方法第25-27页
第三章 微博热点话题检测算法设计第27-40页
    3.1 微博预处理第27-30页
        3.1.1 微博去噪处理第27页
        3.1.2 微博时间窗口划分第27页
        3.1.3 中文分词方法第27-29页
        3.1.4 ICTCLAS汉语分词第29-30页
    3.2 微博文本建模第30-34页
        3.2.1 文本特征表示第30-31页
        3.2.2 文本特征选择第31-32页
        3.2.3 特征项权重计算第32-34页
    3.3 微博关键词聚类第34-40页
        3.3.1 相似度计算第35-36页
        3.3.2 聚类方法介绍第36-37页
        3.3.3 基于关键词的增量聚类第37-40页
第四章 实验测试与结果分析第40-45页
    4.1 实验数据源第40页
    4.2 测试方法第40页
    4.3 实验设计及结果分析第40-45页
        4.3.1 关键词聚类结果第40-41页
        4.3.2 不同的关键词检测方法对比实验第41-43页
        4.3.3 相似度模型对比实验第43-45页
第五章 微博热点话题检测系统的设计与实现第45-54页
    5.1 微博热点话题检测系统的设计第45-49页
        5.1.1 微博热点话题检测系统框架第45-46页
        5.1.2 数据库的设计第46-49页
    5.2 微博热点话题检测系统的实现第49-54页
        5.2.1 系统运行环境第49页
        5.2.2 系统各功能模块的实现第49-54页
总结与展望第54-56页
参考文献第56-59页
致谢第59-60页
个人简历、在学期间的研究成果及发表的学术论文第60页

论文共60页,点击 下载论文
上一篇:飞机租赁对中国航空公司效益的影响
下一篇:飞机拥有方式对航空公司资本结构的影响研究