网络信息动态采集策略的研究及应用
摘要 | 第1-5页 |
Abstract | 第5-8页 |
第1章 绪论 | 第8-11页 |
·课题研究的背景及意义 | 第8-9页 |
·课题的主要工作和创新点 | 第9-10页 |
·本文研究内容及组织结构 | 第10-11页 |
第2章 搜索引擎的相关技术 | 第11-24页 |
·搜索引擎概述 | 第11-15页 |
·搜索引擎的起源与发展 | 第11页 |
·搜索引擎的发展现状 | 第11-13页 |
·搜索引擎的分类 | 第13-15页 |
·网络爬虫的概述 | 第15-19页 |
·基本原理 | 第16页 |
·搜索策略 | 第16-17页 |
·漫游空间的划分 | 第17-18页 |
·更新周期 | 第18页 |
·爬虫礼节 | 第18-19页 |
·增量采集 | 第19页 |
·动态信息采集技术 | 第19-23页 |
·网页变化规律的研究 | 第19-21页 |
·动态采集研究 | 第21-23页 |
·本章小结 | 第23-24页 |
第3章 动态更新算法设计 | 第24-38页 |
·动态采集策略的提出 | 第24-27页 |
·动态采集的思想 | 第24-25页 |
·改进策略 | 第25-27页 |
·更新调整 | 第27页 |
·动态更新算法的结构 | 第27-28页 |
·动态更新算法的流程图 | 第28-29页 |
·动态更新的具体算法 | 第29页 |
·动态采集实验 | 第29-37页 |
·算法实现与分析 | 第29-31页 |
·采集实验的评价 | 第31-33页 |
·固定周期与动态采集的比较研究 | 第33-35页 |
·平均法动态采集与黄金分割法动态采集的比较研究 | 第35-37页 |
·本章小结 | 第37-38页 |
第4章 动态更新算法的改进 | 第38-49页 |
·基于网站优先级动态调整的动态采集算法 | 第38-39页 |
·改进的平均动态采集算法 | 第39-42页 |
·采集周期内部算法流程图 | 第39-40页 |
·优先级表征指标 | 第40-41页 |
·采样数量对网页的采集滞后时间的影响 | 第41-42页 |
·网页发布时间的采集 | 第42页 |
·算法实验与分析 | 第42-47页 |
·平均动态采集法与课题组动态采集算法的比较 | 第42-45页 |
·改进的动态采集算法的实验及分析 | 第45-47页 |
·本章小结 | 第47-49页 |
结论 | 第49-50页 |
1. 论文工作总结 | 第49页 |
2. 下一步研究的建议 | 第49-50页 |
参考文献 | 第50-54页 |
攻读硕士学位期间所发表的论文 | 第54-55页 |
致谢 | 第55-56页 |
个人简历 | 第56页 |