基于异常检测技术的数据防爬系统设计与应用
摘要 | 第5-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第10-18页 |
1.1 研究背景与意义 | 第10-11页 |
1.2 研究现状及进展 | 第11-15页 |
1.2.1 互联网数据开放 | 第11-12页 |
1.2.2 大数据处理技术 | 第12页 |
1.2.3 网页爬虫技术研究 | 第12-14页 |
1.2.4 异常检测技术 | 第14-15页 |
1.2.5 防爬方面的技术 | 第15页 |
1.3 本文主要研究内容 | 第15-16页 |
1.4 本文组织结构 | 第16-18页 |
第二章 关键技术分析 | 第18-34页 |
2.1 异常检测技术 | 第18-24页 |
2.1.1 时间序列数据 | 第19页 |
2.1.2 Breakout检测算法 | 第19-22页 |
2.1.3 3-Sigmal相关算法 | 第22-24页 |
2.2 大数据处理技术 | 第24-30页 |
2.2.1 数据采集技术 | 第24-28页 |
2.2.2 实时计算技术 | 第28-30页 |
2.3 分布式缓存 | 第30-32页 |
2.4 小结 | 第32-34页 |
第三章 防爬系统的设计与实现 | 第34-58页 |
3.1 数据特征及分析需求 | 第34-36页 |
3.1.1 信息服务网站数据统计需求 | 第35页 |
3.1.2 信息服务网站的防爬需求 | 第35-36页 |
3.2 总体设计 | 第36-37页 |
3.3 数据采集层设计与实现 | 第37-42页 |
3.3.1 采集数据的类型与格式 | 第37-38页 |
3.3.2 数据采集模式设计与实现 | 第38-42页 |
3.4 实时分析设计与实现 | 第42-50页 |
3.4.1 实时分析总体结构 | 第42-45页 |
3.4.2 异常检测算法设计与实现 | 第45-46页 |
3.4.3 Breakout算法设计与实现 | 第46-47页 |
3.4.4 降低误报设计与实现 | 第47-50页 |
3.5 数据防爬层设计与实现 | 第50-56页 |
3.5.1 客户端设计与实现 | 第51-54页 |
3.5.2 服务端设计与实现 | 第54-56页 |
3.6 小结 | 第56-58页 |
第四章 应用与效果分析 | 第58-68页 |
4.1 系统运行环境 | 第58-61页 |
4.1.1 支撑软件环境 | 第59页 |
4.1.2 系统逻辑架构 | 第59-61页 |
4.2 系统应用 | 第61-66页 |
4.2.1 后台管理 | 第61-64页 |
4.2.2 数据分析 | 第64-65页 |
4.2.3 应用效果 | 第65-66页 |
4.3 小结 | 第66-68页 |
第五章 结论与展望 | 第68-70页 |
5.1 结论 | 第68页 |
5.2 展望 | 第68-70页 |
参考文献 | 第70-74页 |
致谢 | 第74-76页 |
个人简历、在学期间发表的论文与研究成果 | 第76页 |