Deep Web信息抽取系统的研究与实现

摘要	第1-3页
Abstract	第3-6页
第一章绪论	第6-10页
·研究的目的和意义	第6-7页
·研究现状	第7-8页
·本文研究内容	第8页
·本文的创新点	第8-9页
·本文组织结构	第9-10页
第二章 Deep Web信息抽取的相关问题	第10-18页
·Web信息抽取	第10-12页
·信息抽取的发展	第10-11页
·Web信息抽取	第11-12页
·Deep Web信息抽取系统	第12-13页
·响应页面的获取	第13-14页
·Web页面	第14-16页
·HTML	第14-15页
·CSS	第15-16页
·脚本	第16页
·页面预处理	第16-18页
第三章基于XML的 Web信息抽取	第18-32页
·XML及其相关技术	第18-22页
·XML概述	第18-20页
·XSL与 XSLT转换	第20-21页
·Xpath	第21-22页
·基于 XML的 Web信息抽取	第22-23页
·Web页面清理	第23-27页
·页面清理的对象	第23-26页
·页面清理规则	第26-27页
·HTML到 XML转换	第27-29页
·通过 XSLT抽取信息	第29-32页
·编写 XSLT样式表	第29-30页
·XSLT处理	第30-32页
第四章 Web页面自动抽取算法	第32-44页
·基于页面分块的 Web页面抽取算法	第32-33页
·Web页面分块	第33-36页
·CSS盒模型	第34页
·页面分块	第34-36页
·数据区域识别	第36-38页
·数据区域定义	第36-37页
·数据区域识别算法	第37-38页
·数据项提取	第38-43页
·块之间的相似度	第38-41页
·根据块间相似度的数据项提取	第41-43页
·算法实验与分析	第43-44页
第五章 Deep Web信息抽取系统实现	第44-52页
·Deep Web信息抽取系统设计方案	第44-47页
·Web信息抽取系统的评价	第44页
·不同的Web信息抽取方式	第44-45页
·可伸缩的Deep Web信息抽取系统设计方案	第45-47页
·原型系统的实现	第47-50页
·系统总体结构	第47-48页
·任务管理模块	第48页
·规则管理模块	第48-50页
·页面处理模块	第50页
·本文研究的应用	第50-52页
第六章总结与展望	第52-54页
·本文研究工作总结	第52-53页
·下一步工作展望	第53-54页
致谢	第54-55页
主要参考文献	第55-58页
附录一	第58-59页
附录二	第59-60页