跨媒体热点追踪系统的研究与实现
摘要 | 第4-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第10-15页 |
1.1 课题背景及研究目的和意义 | 第10-11页 |
1.2 相关领域的进展与成果 | 第11-13页 |
1.2.1 跨媒体信息传播的研究现状 | 第11页 |
1.2.2 网络信息爬取技术的研究现状 | 第11-12页 |
1.2.3 热点追踪技术的研究现状 | 第12-13页 |
1.2.4 用户影响力分析技术的研究现状 | 第13页 |
1.3 本文主要工作内容及章节安排 | 第13-15页 |
第2章 跨媒体热点追踪系统概述 | 第15-27页 |
2.1 系统功能目标 | 第15-16页 |
2.2 系统整体结构设计 | 第16-17页 |
2.3 各个子系统简介 | 第17-18页 |
2.4 系统关键理论及技术 | 第18-26页 |
2.4.1 新浪微博数据的采集 | 第18-21页 |
2.4.2 事件发现与分析 | 第21-23页 |
2.4.3 信息传播分析 | 第23-24页 |
2.4.4 用户影响力分析算法 | 第24-26页 |
2.5 本章小结 | 第26-27页 |
第3章 跨媒体信息采集子系统设计与实现 | 第27-41页 |
3.1 总体设计方案及关键策略 | 第27-30页 |
3.1.1 总体设计 | 第27-28页 |
3.1.2 热点词识别策略 | 第28页 |
3.1.3 并行爬取策略 | 第28-29页 |
3.1.4 增量式爬取策略 | 第29-30页 |
3.2 各模块的设计与实现 | 第30-38页 |
3.2.1 热点词识别 | 第30-32页 |
3.2.2 并行调度队列 | 第32-34页 |
3.2.3 新闻信息的采集 | 第34-35页 |
3.2.4 微博信息的采集 | 第35-38页 |
3.3 实验与分析 | 第38-40页 |
3.3.1 热点词识别测试与分析 | 第38-39页 |
3.3.2 信息采集测试与分析 | 第39-40页 |
3.4 本章小结 | 第40-41页 |
第4章 跨媒体信息关联子系统设计与实现 | 第41-59页 |
4.1 总体设计方案及关键策略 | 第41-45页 |
4.1.1 总体方案 | 第41-43页 |
4.1.2 跨媒体信息事件关联策略 | 第43页 |
4.1.3 跨媒体信息精确关联策略 | 第43-45页 |
4.2 各模块的设计与实现 | 第45-53页 |
4.2.1 文本预处理 | 第45页 |
4.2.2 事件划分 | 第45-50页 |
4.2.3 跨媒体信息关联 | 第50-53页 |
4.3 实验与分析 | 第53-58页 |
4.3.1 新闻的事件划分测试 | 第53-54页 |
4.3.2 微博的事件划分测试 | 第54-56页 |
4.3.3 跨媒体信息事件关联测试 | 第56页 |
4.3.4 跨媒体信息精确关联测试 | 第56-58页 |
4.4 本章小结 | 第58-59页 |
第5章 跨媒体信息分析子系统设计与实现 | 第59-78页 |
5.1 总体设计方案 | 第59-62页 |
5.1.1 跨媒体传播模型的构建 | 第59-60页 |
5.1.2 基于微博的事件传播网的构建 | 第60-61页 |
5.1.3 基于事件的微博用户影响力分析 | 第61-62页 |
5.2 各模块的设计与实现 | 第62-69页 |
5.2.1 跨媒体信息传播模型的构建 | 第62-66页 |
5.2.2 用户传播影响力分析 | 第66-69页 |
5.3 实验与分析 | 第69-77页 |
5.3.1 跨媒体传播总体分析 | 第69-70页 |
5.3.2 二级传播理论的验证 | 第70-72页 |
5.3.3 用户影响力算法的验证 | 第72-77页 |
5.4 本章小结 | 第77-78页 |
结论 | 第78-79页 |
参考文献 | 第79-83页 |
致谢 | 第83页 |