基于页面预判的微博采集系统设计与实现
摘要 | 第1-6页 |
ABSTRACT | 第6-8页 |
第一章 绪论 | 第8-10页 |
·论文研究的背景和意义 | 第8页 |
·国内外研究现状 | 第8-9页 |
·论文的结构 | 第9-10页 |
第二章 微博信息采集关键技术研究 | 第10-18页 |
·微博采集概述 | 第10页 |
·微博采集的基本原理 | 第10-11页 |
·微博采集技术的分类 | 第11-12页 |
·爬虫技术 | 第12-14页 |
·原始网络爬虫 | 第12-13页 |
·聚焦网络爬虫 | 第13-14页 |
·网页预判技术 | 第14-15页 |
·正则表达式技术 | 第15-17页 |
·本章小结 | 第17-18页 |
第三章 系统需求分析 | 第18-26页 |
·微博微博信息采集面临的主要困难 | 第18页 |
·系统目标和解决的问题 | 第18-19页 |
·系统需求概述 | 第19-24页 |
·系统的功能性需求分析 | 第19-22页 |
·系统的非功能性需求分析 | 第22-24页 |
·本章小结 | 第24-26页 |
第四章 系统设计 | 第26-36页 |
·系统设计目标 | 第26页 |
·系统总体设计 | 第26-30页 |
·技术架构设计 | 第26-27页 |
·功能架构设计 | 第27-28页 |
·具体流程设计 | 第28-30页 |
·系统详细设计 | 第30-32页 |
·系统登录模块 | 第30页 |
·频道采集模块 | 第30-31页 |
·主题处理模块 | 第31-32页 |
·数据导入导出模块 | 第32页 |
·数据库设计 | 第32-34页 |
·创建数据库 | 第32页 |
·数据库表的设计 | 第32-34页 |
·本章小结 | 第34-36页 |
第五章 系统实现与测试 | 第36-48页 |
·开发环境 | 第36-37页 |
·系统主要模块的实现 | 第37-43页 |
·微博种子的提取和处理 | 第37页 |
·频道采集模块的实现 | 第37-40页 |
·主题采集模块的实现 | 第40-42页 |
·数据导入导出模块的实现 | 第42-43页 |
·基于预判的微博采集系统的演示过程 | 第43-44页 |
·系统测试 | 第44-46页 |
·采集速度 | 第45页 |
·采集性能 | 第45-46页 |
·本章小结 | 第46-48页 |
第六章 总结与展望 | 第48-50页 |
参考文献 | 第50-52页 |
致谢 | 第52页 |