特定新闻门户网站的信息获取

摘要	第4-5页
Abstract	第5-6页
第1章绪论	第10-16页
1.1 研究背景和意义	第10-12页
1.2 研究现状	第12-13页
1.3 主要研究内容	第13页
1.4 论文结构安排	第13-16页
第2章相关技术	第16-26页
2.1 网络爬虫的介绍	第16-19页
2.1.1 URL 简介	第16-17页
2.1.2 网络爬虫的框架	第17-18页
2.1.3 网络爬虫的爬行策略及其原理	第18-19页
2.2 网页结构分析与 DOM 树	第19-21页
2.3 信息提取	第21-23页
2.3.1 信息提取的简介	第21-23页
2.3.2 信息提取框架	第23页
2.4 java 和 MyEclipse 技术	第23-25页
2.4.1 java 的主要特性	第23-25页
2.4.2 MyEclipse 技术	第25页
2.5 本章小结	第25-26页
第3章需求分析	第26-32页
3.1 任务概述	第26页
3.1.1 目标	第26页
3.1.2 用户	第26页
3.1.3 约束和限制	第26页
3.2 功能性需求分析	第26-30页
3.2.1 功能需求	第26-27页
3.2.2 主要功能划分	第27-29页
3.2.3 其他功能划分	第29-30页
3.3 外部接口需求	第30页
3.3.1 用户界面	第30页
3.3.2 接口	第30页
3.4 非功能性需求分析	第30-31页
3.5 本章小结	第31-32页
第4章系统设计	第32-38页
4.1 系统设计原则	第32-34页
4.2 系统体系结构	第34-35页
4.3 系统详细设计	第35-37页
4.3.1 网页抓取模块	第35-36页
4.3.2 网页解析模块	第36-37页
4.3.3 信息管理模块	第37页
4.4 本章小结	第37-38页
第5章系统实现	第38-47页
5.1 系统实现的环境	第38-39页
5.2 页面布局框架	第39页
5.3 系统代码实现	第39-41页
5.4 系统的功能模块	第41-46页
5.4.1 搜索模块	第41-43页
5.4.2 前进和后退功能模块	第43-45页
5.4.3 查看原网页模块	第45-46页
5.4.4 清除功能模块	第46页
5.4.5 帮助模块	第46页
5.5 本章小结	第46-47页
第6章总结与展望	第47-49页
6.1 总结	第47页
6.2 展望	第47-49页
参考文献	第49-52页
作者简介及在学期间所取得的科研成果	第52-53页
致谢	第53页