基于JSSh的信息采集技术研究与实现

摘要	第6-8页
ABSTRACT	第8-9页
第一章绪论	第12-17页
1.1 本课题研究的必要性及意义	第12-14页
1.2 研究现状	第14-15页
1.3 论文的研究内容及组织安排	第15-17页
第二章相关基础知识	第17-30页
2.1 身份认证	第17-20页
2.1.1 双因子认证(two-factor authentication)	第18页
2.1.2 一次性口令技术（One-Time Password）	第18-19页
2.1.3 Kerberos 认证服务	第19-20页
2.2 文档对象模型	第20-21页
2.3 动态网页	第21-26页
2.3.1 JavaScript	第23-24页
2.3.2 Ajax	第24-26页
2.4 互联网内容获取模型	第26-28页
2.5 Deep Web	第28-29页
2.6 本章小结	第29-30页
第三章基于JSSh 的网站自动身份认证	第30-46页
3.1 概述	第30页
3.2 基于HTTP Cookie 的网站身份认证过程	第30-34页
3.3 JSSh 工作原理	第34-37页
3.3.1 XPCOM	第34-35页
3.3.2 网页排版引擎（Layout Engine）	第35-36页
3.3.3 JSSh 客户端/服务器工作模式	第36-37页
3.4 网站自动身份认证	第37-45页
3.4.1 身份认证表单自动填写	第39-42页
3.4.2 身份认证及信息请求交互	第42页
3.4.3 利用JSSh 采集网站发布内容	第42-43页
3.4.4 利用网页获取工具采集网站发布内容	第43-45页
3.5 本章小结	第45-46页
第四章基于JSSh 的动态网页采集	第46-56页
4.1 概述	第46页
4.2 动态网页解析技术	第46-51页
4.2.1 利用SpiderMonkey 解析动态网页	第47-49页
4.2.2 利用 Rhino 解析动态网页	第49-50页
4.2.3 利用Gecko 解析动态网页	第50-51页
4.3 动态网页DOM 构建	第51-53页
4.4 从DOM 中采集网站发布内容	第53页
4.5 动态网页的采集效率	第53-55页
4.6 本章小结	第55-56页
第五章基于JSSh 的信息采集系统实现	第56-67页
5.1 概述	第56页
5.2 FireWatir 简介	第56-57页
5.3 系统实现	第57-62页
5.3.1 自动身份认证模块实现	第58-61页
5.3.2 动态网页采集模块实现	第61-62页
5.4 性能评估实验结果	第62-66页
5.5 本章小结	第66-67页
第六章总结和展望	第67-69页
6.1 主要结论	第67页
6.2 研究展望	第67-69页
参考文献	第69-72页
致谢	第72-73页
攻读硕士学位期间已发表或录用的论文	第73页