摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第1章 绪论 | 第10-15页 |
1.1 研究背景及意义 | 第10-13页 |
1.1.1 研究背景 | 第10-13页 |
1.1.2 研究意义 | 第13页 |
1.2 本文主要研究内容 | 第13-14页 |
1.2.1 海量微博数据自动化爬取采集技术 | 第13页 |
1.2.2 基于目标用户微博内容的兴趣关键词抽取模型 | 第13页 |
1.2.3 基于关联用户微博内容的兴趣关键词抽取模型 | 第13-14页 |
1.2.4 微博用户兴趣挖掘平台架构设计与实现 | 第14页 |
1.3 本文章节安排 | 第14-15页 |
第2章 相关技术综述 | 第15-24页 |
2.1 网络爬虫技术 | 第15-16页 |
2.1.1 网络爬虫背景 | 第15页 |
2.1.2 网络爬虫现状分析 | 第15-16页 |
2.2 中文切词技术 | 第16-18页 |
2.2.1 中文切词背景 | 第16-17页 |
2.2.2 中文切词现状分析 | 第17-18页 |
2.3 关键词抽取技术 | 第18-19页 |
2.3.1 关键词抽取背景 | 第18-19页 |
2.3.2 关键词抽取现状分析 | 第19页 |
2.4 用户兴趣建模技术 | 第19-21页 |
2.4.1 用户兴趣建模背景 | 第19-20页 |
2.4.2 用户兴趣建模现状分析 | 第20-21页 |
2.5 其他相关技术 | 第21-23页 |
2.5.1 分类算法 | 第22页 |
2.5.2 PageRank算法 | 第22-23页 |
2.6 本章小结 | 第23-24页 |
第3章 微博用户兴趣挖掘平台架构 | 第24-29页 |
3.1 平台设计思想 | 第24页 |
3.2 平台架构 | 第24-25页 |
3.3 平台功能层次框架设计 | 第25-28页 |
3.3.1 数据层 | 第25-26页 |
3.3.2 算法层 | 第26页 |
3.3.3 应用层 | 第26页 |
3.3.4 用户层 | 第26-28页 |
3.4 本章小结 | 第28-29页 |
第4章 基于模拟浏览器行为的海量微博数据爬取采集 | 第29-49页 |
4.1 概述 | 第29页 |
4.2 基于微博API的数据采集方案 | 第29-34页 |
4.2.1 应用创建流程与OAuth2.0授权 | 第29-30页 |
4.2.2 微博API数据采集实现 | 第30-34页 |
4.2.3 基于微博API采集微博数据优缺点 | 第34页 |
4.3 基于模拟浏览器行为的微博数据采集方案 | 第34-44页 |
4.3.1 网页数据分析工具(HttpWatch) | 第34-37页 |
4.3.2 微博模拟登录 | 第37-39页 |
4.3.3 微博数据抓取 | 第39-43页 |
4.3.4 微博数据解析 | 第43-44页 |
4.3.5 微博数据存储 | 第44页 |
4.3.6 基于模拟浏览器行为爬取采集微博数据优缺点 | 第44页 |
4.4 数值实验与结果分析 | 第44-48页 |
4.4.1 实验结果 | 第45-47页 |
4.4.2 实验分析 | 第47-48页 |
4.5 本章小结 | 第48-49页 |
第5章 基于目标用户微博内容的兴趣模型 | 第49-59页 |
5.1 概述 | 第49-53页 |
5.1.1 微博用户内容 | 第49-51页 |
5.1.2 微博用户自身信息与用户兴趣关系 | 第51-53页 |
5.2 基于改进的TF-IDF算法模型的微博用户兴趣关键词抽取 | 第53-56页 |
5.2.1 基本IDF词典构建及定时更新 | 第53页 |
5.2.2 基于联合兴趣度的动态IDF词典构建 | 第53-55页 |
5.2.3 基于微博内容构建用户兴趣关键词研究 | 第55-56页 |
5.3 数值实验与结果分析 | 第56-58页 |
5.4 本章小结 | 第58-59页 |
第6章 基于关联用户微博内容的兴趣模型 | 第59-69页 |
6.1 概述 | 第59-61页 |
6.1.1 微博用户关系 | 第59页 |
6.1.2 关联用户微博内容与目标用户的兴趣关系 | 第59-61页 |
6.2 基于关联用户微博内容的兴趣关键词抽取 | 第61页 |
6.3 广义僵尸用户识别 | 第61-66页 |
6.3.1 广义僵尸用户特征分析和选择 | 第63-65页 |
6.3.2 广义僵尸用户识别分析 | 第65-66页 |
6.4 微博关联用户重要性排名算法(RelationRank) | 第66-68页 |
6.4.1 RelationRank算法思想 | 第66页 |
6.4.2 RelationRank算法具体实现 | 第66-68页 |
6.5 本章小结 | 第68-69页 |
第7章 微博用户兴趣挖掘平台实现与应用 | 第69-78页 |
7.1 微博用户兴趣挖掘平台总体设计 | 第69页 |
7.1.1 平台设计目标 | 第69页 |
7.1.2 平台主要功能模块 | 第69页 |
7.2 微博用户兴趣挖掘平台实现 | 第69-75页 |
7.2.1 微博数据采集模块 | 第69-70页 |
7.2.2 基于目标用户微博内容兴趣关键词构建模块 | 第70-72页 |
7.2.3 基于关联用户微博内容兴趣关键词构建模块 | 第72-74页 |
7.2.4 兴趣关键词可视化模块 | 第74-75页 |
7.3 微博用户兴趣挖掘平台实验测试 | 第75-77页 |
7.4 本章小结 | 第77-78页 |
第8章 总结和展望 | 第78-79页 |
8.1 研究工作总结 | 第78页 |
8.2 进一步研究展望 | 第78-79页 |
参考文献 | 第79-85页 |
致谢 | 第85-86页 |
附录1 | 第86-87页 |
附录2 | 第87-89页 |
附录3 | 第89-91页 |