非结构化Deep Web信息的自动抽取

提要	第1-7页
第一章绪论	第7-18页
·DeepWeb的概念	第8-9页
·DeepWeb的类型	第9-12页
·DeepWeb的特点	第12-13页
·DeepWeb搜索引擎爬虫	第13-17页
·爬虫的组成原理	第14-15页
·爬虫的关键技术	第15-17页
·本文的工作	第17-18页
第二章相关知识介绍	第18-30页
·标记语言	第18-21页
·表单	第21-24页
·POST与GET	第24-25页
·SAX与DOM	第25-27页
·正则表达式	第27-28页
·信息抽取技术	第28-30页
第三章查询响应页面的信息抽取	第30-49页
·DeepWeb的探查	第30-33页
·响应页面的格式转换	第33-35页
·抽取查询结果对应标签路径	第35-42页
·抽取查询结果总数对应标签路径	第42-44页
·识别异常响应页面	第44-46页
·下载非结构化文件资源	第46-47页
·相关数据结构	第47-49页
第四章实验部分	第49-55页
·实验对象	第49-50页
·Dialog检索系统	第49页
·PubMed检索系统	第49-50页
·Ovid检索系统	第50页
·实验过程	第50-55页
·响应页面的获取与格式转换	第50-51页
·抽取查询结果对应标签路径	第51-53页
·抽取查询结果总数对应标签路径	第53-54页
·识别异常响应页面与下载资源	第54-55页
第五章总结与展望	第55-57页
参考文献	第57-60页
摘要	第60-63页
Abstract	第63-66页
致谢	第66-67页
导师及作者简介	第67页