| 摘要 | 第1页 |
| ABSTRACT | 第4-7页 |
| 第一章 绪论 | 第7-12页 |
| ·选题背景及意义 | 第7-8页 |
| ·国内外研究现状 | 第8-9页 |
| ·本文的工作与创新 | 第9-11页 |
| ·论文的组织 | 第11页 |
| ·本章小结 | 第11-12页 |
| 第二章 WEB页面结构分析 | 第12-16页 |
| ·HTML介绍 | 第12-13页 |
| ·HTML组成 | 第12-13页 |
| ·HTML结构树 | 第13页 |
| ·XML和XHTML | 第13-15页 |
| ·可扩展标记语言XML | 第13-14页 |
| ·可扩展超文本标记语言XHTML | 第14-15页 |
| ·本章小结 | 第15-16页 |
| 第三章 DOM树结构的研究与设计 | 第16-23页 |
| ·DOM技术研究 | 第16-17页 |
| ·DOM树结构设计 | 第17-18页 |
| ·DOM树结构操作 | 第18-22页 |
| ·本章小结 | 第22-23页 |
| 第四章 网页清洗技术的研究与设计 | 第23-27页 |
| ·网页清洗技术 | 第23-24页 |
| ·网页清洗步骤 | 第24页 |
| ·网页清洗技术设计 | 第24-26页 |
| ·本章小结 | 第26-27页 |
| 第五章 基于WEB的HTML网页清洗工具的设计与实现 | 第27-48页 |
| ·系统需求分析 | 第27页 |
| ·系统总体设计 | 第27页 |
| ·系统详细设计 | 第27-35页 |
| ·基于HTTP协议的Web代理服务器的设计与实现 | 第28-32页 |
| ·HTTP协议 | 第28-30页 |
| ·HTTP协议的作用原理 | 第30页 |
| ·HTTP协议的实现过程 | 第30-32页 |
| ·基于DOM的HTML网页解析 | 第32-34页 |
| ·HTML页面清洗算法设计与实现 | 第34-35页 |
| ·系统实现 | 第35-43页 |
| ·开发环境 | 第35页 |
| ·系统界面 | 第35-43页 |
| ·实验结果 | 第43-46页 |
| ·本章小结 | 第46-48页 |
| 第六章 总结与展望 | 第48-50页 |
| 参考文献 | 第50-53页 |
| 致谢 | 第53-54页 |
| 在学期间发表的学术论文和参加科研情况 | 第54页 |