大规模微博数据转发关系提取和事件归并技术研究与实现
摘要 | 第4-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第12-16页 |
1.1 研究背景及意义 | 第12-13页 |
1.2 国内外相关研究综述 | 第13-14页 |
1.3 主要研究工作 | 第14-15页 |
1.4 论文结构安排 | 第15-16页 |
第2章 相关技术 | 第16-28页 |
2.1 微博地址连接以及内容采集技术 | 第16-20页 |
2.2 网络爬虫 | 第20-21页 |
2.3 抓取目标描述 | 第21-22页 |
2.4 微博信息分析 | 第22页 |
2.5 微博信息挖掘 | 第22页 |
2.6 归并处理 | 第22-23页 |
2.7 抽取算法 | 第23页 |
2.8 微博用户模型的维度划分 | 第23-24页 |
2.9 属性和兴趣维度 | 第24-25页 |
2.10 社交维度 | 第25-26页 |
2.11 行为维度 | 第26-27页 |
2.12 本章小结 | 第27-28页 |
第3章 系统需求分析 | 第28-38页 |
3.1 需求概述 | 第28-30页 |
3.2 功能性需求分析 | 第30-32页 |
3.2.1 系统用户管理模块需求分析 | 第30页 |
3.2.2 传播趋势模块 | 第30-31页 |
3.2.3 传播路径模块 | 第31页 |
3.2.4 数据分析模块 | 第31-32页 |
3.2.5 点赞分析 | 第32页 |
3.3 数据库需求分析 | 第32-37页 |
3.3.1 微博信息表 | 第32-33页 |
3.3.2 微博用户信息表 | 第33-34页 |
3.3.3 系统用户权限表设计 | 第34-37页 |
3.4 本章小结 | 第37-38页 |
第4章 系统的设计 | 第38-66页 |
4.1 系统总体架构 | 第38-40页 |
4.2 系统功能模块划分 | 第40-42页 |
4.3 服务器数据库设计 | 第42-47页 |
4.4 服务器数据采集模块设计 | 第47-51页 |
4.4.1 服务器爬虫模块 | 第47-48页 |
4.4.2 HTTP数据包 | 第48-51页 |
4.4.3 具体爬虫操作 | 第51页 |
4.5 服务器微博数据处理 | 第51-55页 |
4.5.1 微博文本提取模块 | 第51-52页 |
4.5.2 微博关键词分析提取模块 | 第52-54页 |
4.5.3 分词预处理模块 | 第54-55页 |
4.6 客户端用户管理模块设计 | 第55-57页 |
4.7 客户端微博用户跟踪模块设计 | 第57-59页 |
4.8 客户端用户检索模块设计 | 第59-61页 |
4.8.1 跟据微博用户昵称进行检索 | 第59页 |
4.8.2 根据不定条件进行检索 | 第59-61页 |
4.9 客户端传播查询模块设计 | 第61-64页 |
4.10 本章小结 | 第64-66页 |
第5章 系统的实现 | 第66-76页 |
5.1 服务器端总体结构 | 第66-67页 |
5.2 客户端实现展示界面 | 第67-74页 |
5.2.1 登录页面 | 第67-68页 |
5.2.2 注册新用户页面 | 第68页 |
5.2.3 功能菜单 | 第68-69页 |
5.2.4 用户分析界面 | 第69页 |
5.2.5 微博分析结果显示界面 | 第69-70页 |
5.2.6 微博转发数/评论数时间趋势分析界面 | 第70页 |
5.2.7 微博关键词分析界面 | 第70-71页 |
5.2.8 微博粉丝关系分析界面 | 第71-73页 |
5.2.9 用户地域分布分析界面 | 第73页 |
5.2.10 用户比例分析界面 | 第73-74页 |
5.3 本章小结 | 第74-76页 |
第6章 系统部署与测试 | 第76-82页 |
6.1 概述 | 第76页 |
6.1.1 软件测试设计环境 | 第76页 |
6.1.2 软件测试实施环境 | 第76页 |
6.1.3 软件测试管理环境 | 第76页 |
6.2 部署环境要求 | 第76-77页 |
6.3 bug测试基本流程 | 第77页 |
6.4 测试用例 | 第77-78页 |
6.5 数据爬虫部分测试结果 | 第78-79页 |
6.6 系统性能测试 | 第79-81页 |
6.7 测试结果分析 | 第81页 |
6.7.1 存在的问题 | 第81页 |
6.7.2 下一步研究计划 | 第81页 |
6.8 本章小结 | 第81-82页 |
结论 | 第82-84页 |
参考文献 | 第84-90页 |
致谢 | 第90页 |