基于Web的HTML网页清洗技术的研究与实现

摘要	第1页
ABSTRACT	第4-7页
第一章绪论	第7-12页
·选题背景及意义	第7-8页
·国内外研究现状	第8-9页
·本文的工作与创新	第9-11页
·论文的组织	第11页
·本章小结	第11-12页
第二章 WEB页面结构分析	第12-16页
·HTML介绍	第12-13页
·HTML组成	第12-13页
·HTML结构树	第13页
·XML和XHTML	第13-15页
·可扩展标记语言XML	第13-14页
·可扩展超文本标记语言XHTML	第14-15页
·本章小结	第15-16页
第三章 DOM树结构的研究与设计	第16-23页
·DOM技术研究	第16-17页
·DOM树结构设计	第17-18页
·DOM树结构操作	第18-22页
·本章小结	第22-23页
第四章网页清洗技术的研究与设计	第23-27页
·网页清洗技术	第23-24页
·网页清洗步骤	第24页
·网页清洗技术设计	第24-26页
·本章小结	第26-27页
第五章基于WEB的HTML网页清洗工具的设计与实现	第27-48页
·系统需求分析	第27页
·系统总体设计	第27页
·系统详细设计	第27-35页
·基于HTTP协议的Web代理服务器的设计与实现	第28-32页
·HTTP协议	第28-30页
·HTTP协议的作用原理	第30页
·HTTP协议的实现过程	第30-32页
·基于DOM的HTML网页解析	第32-34页
·HTML页面清洗算法设计与实现	第34-35页
·系统实现	第35-43页
·开发环境	第35页
·系统界面	第35-43页
·实验结果	第43-46页
·本章小结	第46-48页
第六章总结与展望	第48-50页
参考文献	第50-53页
致谢	第53-54页
在学期间发表的学术论文和参加科研情况	第54页