首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

支持JavaScript解析的网页采集系统设计与实现

摘要第1-6页
ABSTRACT第6-11页
第1章 绪论第11-15页
   ·研究背景第11-12页
   ·支持javascript解析的网页采集技术发展现状第12-13页
   ·本文主要工作第13页
   ·本文组织结构第13-15页
第2章 相关技术介绍第15-33页
   ·javascript简介第15-17页
     ·javascript语言概况第15页
     ·javascript语言组成第15-16页
     ·javascript在网页中的用法第16-17页
   ·解析javascript的方法第17-18页
   ·JS引擎介绍第18-21页
     ·SpiderMonkey简介第18-20页
     ·SpiderMonkey的使用第20-21页
   ·搜索引擎简介第21-22页
   ·搜索引擎组成部分第22-25页
     ·爬虫器第22-23页
     ·索引器第23-24页
     ·索引库第24页
     ·检索引擎第24-25页
   ·搜索引擎国内外研究现状第25-26页
   ·搜索引擎主要指标第26页
   ·搜索引擎搜索策略第26-31页
     ·无启发式搜索策略第27-29页
     ·启发式搜索策略第29-30页
     ·对广度优先搜索的优化第30-31页
   ·本章小结第31-33页
第3章 javascript解析器的设计与实现第33-45页
   ·引言第33页
   ·处理javascript的必要性第33-35页
   ·网页抓取对javascript解析的需求第35-36页
   ·JSParser设计第36-43页
     ·总体结构设计第36-37页
     ·初始化JSParser第37-38页
     ·总控制程序第38页
     ·读取语句控制第38-39页
     ·解释执行控制第39页
     ·解释执行第39-42页
     ·表达式计算第42-43页
   ·JSParser性能测试第43页
   ·本章小结第43-45页
第4章 采集系统设计与实现第45-69页
   ·引言第45页
   ·主要技术概要第45-48页
     ·HTTP协议第45-46页
     ·EPOLL技术第46-48页
   ·系统总体设计第48-49页
   ·模块工作模式第49页
   ·采集模块详细设计第49-56页
     ·模块结构图及说明第49-51页
     ·算法描述第51-54页
     ·需要考虑的问题及解决策略第54-56页
   ·控制器设计第56-64页
     ·模块结构图及说明第57-59页
     ·URL接收第59-61页
     ·URL选取第61-62页
     ·URL分发第62-63页
     ·页面收集第63-64页
     ·URL监控第64页
   ·系统测试第64-67页
     ·JSParser对采集系统性能的影响第64-65页
     ·采集系统性能测试第65-67页
   ·本章小结第67-69页
第5章 总结与展望第69-71页
   ·工作总结第69页
   ·下一步的工作第69-71页
参考文献第71-75页
致谢第75页

论文共75页,点击 下载论文
上一篇:一种基于T-RBAC的访问控制模型的研究与应用
下一篇:基于群体智能的ABC支持型切换管理机制的设计与仿真实现