支持JavaScript解析的网页采集系统设计与实现

摘要	第1-6页
ABSTRACT	第6-11页
第1章绪论	第11-15页
·研究背景	第11-12页
·支持javascript解析的网页采集技术发展现状	第12-13页
·本文主要工作	第13页
·本文组织结构	第13-15页
第2章相关技术介绍	第15-33页
·javascript简介	第15-17页
·javascript语言概况	第15页
·javascript语言组成	第15-16页
·javascript在网页中的用法	第16-17页
·解析javascript的方法	第17-18页
·JS引擎介绍	第18-21页
·SpiderMonkey简介	第18-20页
·SpiderMonkey的使用	第20-21页
·搜索引擎简介	第21-22页
·搜索引擎组成部分	第22-25页
·爬虫器	第22-23页
·索引器	第23-24页
·索引库	第24页
·检索引擎	第24-25页
·搜索引擎国内外研究现状	第25-26页
·搜索引擎主要指标	第26页
·搜索引擎搜索策略	第26-31页
·无启发式搜索策略	第27-29页
·启发式搜索策略	第29-30页
·对广度优先搜索的优化	第30-31页
·本章小结	第31-33页
第3章 javascript解析器的设计与实现	第33-45页
·引言	第33页
·处理javascript的必要性	第33-35页
·网页抓取对javascript解析的需求	第35-36页
·JSParser设计	第36-43页
·总体结构设计	第36-37页
·初始化JSParser	第37-38页
·总控制程序	第38页
·读取语句控制	第38-39页
·解释执行控制	第39页
·解释执行	第39-42页
·表达式计算	第42-43页
·JSParser性能测试	第43页
·本章小结	第43-45页
第4章采集系统设计与实现	第45-69页
·引言	第45页
·主要技术概要	第45-48页
·HTTP协议	第45-46页
·EPOLL技术	第46-48页
·系统总体设计	第48-49页
·模块工作模式	第49页
·采集模块详细设计	第49-56页
·模块结构图及说明	第49-51页
·算法描述	第51-54页
·需要考虑的问题及解决策略	第54-56页
·控制器设计	第56-64页
·模块结构图及说明	第57-59页
·URL接收	第59-61页
·URL选取	第61-62页
·URL分发	第62-63页
·页面收集	第63-64页
·URL监控	第64页
·系统测试	第64-67页
·JSParser对采集系统性能的影响	第64-65页
·采集系统性能测试	第65-67页
·本章小结	第67-69页
第5章总结与展望	第69-71页
·工作总结	第69页
·下一步的工作	第69-71页
参考文献	第71-75页
致谢	第75页