摘要 | 第1-4页 |
ABSTRACT | 第4-7页 |
1 绪论 | 第7-11页 |
·研究背景 | 第7-8页 |
·研究现状和发展趋势 | 第8-9页 |
·研究目的及意义 | 第9页 |
·本文研究内容 | 第9-11页 |
2 Deep Web数据集成技术基础 | 第11-19页 |
·搜索引擎 | 第11-12页 |
·搜索引擎分类 | 第11页 |
·搜索引擎工作原理 | 第11-12页 |
·Deep Web | 第12-15页 |
·Deep Web特点 | 第13页 |
·Deep Web规模 | 第13-14页 |
·搜索引擎对Deep Web的覆盖率 | 第14-15页 |
·Deep Web数据集成关键技术 | 第15-19页 |
·Web数据库的发现 | 第15-16页 |
·查询接口的集成 | 第16-17页 |
·查询结果的抽取 | 第17-18页 |
·Web数据的合并 | 第18页 |
·数据的增量维护 | 第18-19页 |
3 林业企业黄页Deep Web数据集成系统分析与设计 | 第19-28页 |
·林业企业黄页Deep Web分析 | 第19-20页 |
·数据源分布特征 | 第19页 |
·信息组织方式特征 | 第19-20页 |
·系统总体需求分析 | 第20-21页 |
·功能模块分析与设计 | 第21-24页 |
·Deep Web数据源管理 | 第22页 |
·Deep Web模板管理 | 第22-24页 |
·数据采集管理 | 第24页 |
·数据整合 | 第24页 |
·数据表设计 | 第24-27页 |
·系统开发环境 | 第27-28页 |
4 系统实现关键技术 | 第28-44页 |
·Deep Web爬虫 | 第28-29页 |
·身份验证 | 第29-30页 |
·导航URL提取 | 第30-35页 |
·翻页URL提取 | 第35-37页 |
·属性数据抽取 | 第37-42页 |
·基于上下文探测法的数据抽取技术 | 第37-39页 |
·基于包装器的数据抽取技术 | 第39-42页 |
·异构数据整合 | 第42-44页 |
5 系统应用实例 | 第44-53页 |
·数据源管理 | 第44-45页 |
·模板配置 | 第45-49页 |
·数据采集 | 第49-50页 |
·数据整合 | 第50-51页 |
·采集性能分析 | 第51-53页 |
6 总结与展望 | 第53-55页 |
·本文主要工作总结 | 第53页 |
·未来工作的展望 | 第53-55页 |
参考文献 | 第55-59页 |
个人简介 | 第59-60页 |
导师简介 | 第60-61页 |
获得成果目录清单 | 第61-62页 |
致谢 | 第62页 |