| 摘要 | 第1-4页 |
| ABSTRACT | 第4-7页 |
| 1 绪论 | 第7-11页 |
| ·研究背景 | 第7-8页 |
| ·研究现状和发展趋势 | 第8-9页 |
| ·研究目的及意义 | 第9页 |
| ·本文研究内容 | 第9-11页 |
| 2 Deep Web数据集成技术基础 | 第11-19页 |
| ·搜索引擎 | 第11-12页 |
| ·搜索引擎分类 | 第11页 |
| ·搜索引擎工作原理 | 第11-12页 |
| ·Deep Web | 第12-15页 |
| ·Deep Web特点 | 第13页 |
| ·Deep Web规模 | 第13-14页 |
| ·搜索引擎对Deep Web的覆盖率 | 第14-15页 |
| ·Deep Web数据集成关键技术 | 第15-19页 |
| ·Web数据库的发现 | 第15-16页 |
| ·查询接口的集成 | 第16-17页 |
| ·查询结果的抽取 | 第17-18页 |
| ·Web数据的合并 | 第18页 |
| ·数据的增量维护 | 第18-19页 |
| 3 林业企业黄页Deep Web数据集成系统分析与设计 | 第19-28页 |
| ·林业企业黄页Deep Web分析 | 第19-20页 |
| ·数据源分布特征 | 第19页 |
| ·信息组织方式特征 | 第19-20页 |
| ·系统总体需求分析 | 第20-21页 |
| ·功能模块分析与设计 | 第21-24页 |
| ·Deep Web数据源管理 | 第22页 |
| ·Deep Web模板管理 | 第22-24页 |
| ·数据采集管理 | 第24页 |
| ·数据整合 | 第24页 |
| ·数据表设计 | 第24-27页 |
| ·系统开发环境 | 第27-28页 |
| 4 系统实现关键技术 | 第28-44页 |
| ·Deep Web爬虫 | 第28-29页 |
| ·身份验证 | 第29-30页 |
| ·导航URL提取 | 第30-35页 |
| ·翻页URL提取 | 第35-37页 |
| ·属性数据抽取 | 第37-42页 |
| ·基于上下文探测法的数据抽取技术 | 第37-39页 |
| ·基于包装器的数据抽取技术 | 第39-42页 |
| ·异构数据整合 | 第42-44页 |
| 5 系统应用实例 | 第44-53页 |
| ·数据源管理 | 第44-45页 |
| ·模板配置 | 第45-49页 |
| ·数据采集 | 第49-50页 |
| ·数据整合 | 第50-51页 |
| ·采集性能分析 | 第51-53页 |
| 6 总结与展望 | 第53-55页 |
| ·本文主要工作总结 | 第53页 |
| ·未来工作的展望 | 第53-55页 |
| 参考文献 | 第55-59页 |
| 个人简介 | 第59-60页 |
| 导师简介 | 第60-61页 |
| 获得成果目录清单 | 第61-62页 |
| 致谢 | 第62页 |