Deep Web数据抽取及集成技术研究

中文摘要	第1-4页
Abstract	第4-10页
第1章绪论	第10-16页
·问题的提出	第10-11页
·国内外研究现状	第11-13页
·本文的特色与贡献	第13-14页
·本文的结构安排	第14-16页
第2章 Web数据对象抽取	第16-26页
·概述	第16-17页
·信息抽取技术的发展历程	第16-17页
·信息抽取技术的分类	第17页
·Web数据对象抽取的定义	第17-19页
·基于DOM的Web数据对象自动抽取方法	第19-25页
·页面预处理	第19-20页
·结构相似度	第20-23页
·内容相似度	第23-25页
·本章小结	第25-26页
第3章 Web数据对象集成	第26-40页
·概述	第26-28页
·集成问题分析	第26-27页
·相关工作	第27-28页
·问题描述	第28-30页
·Web数据对象模式异构的表现形式	第28-30页
·Web数据对象的冗余现象	第30页
·Web数据对象的集成方法	第30-39页
·Web数据对象模式的规范化	第30-36页
·基本思想	第31-32页
·相似度的计算	第32-33页
·模式的规范化过程	第33-36页
·Web数据对象的去重处理	第36-39页
·计算属性的区分度	第36-38页
·Web数据对象去重	第38-39页
·本章小结	第39-40页
第4章海量Web数据对象的组织	第40-52页
·概述	第40-43页
·问题分析	第40-41页
·相关工作	第41-43页
·基于增量层次聚类思想的数据组织方法	第43-51页
·基本原理	第43-44页
·点的定义	第44-45页
·中心点的计算	第45-47页
·根结点的形成	第47页
·相似度的计算	第47-49页
·增量层次聚类	第49-51页
·本章小结	第51-52页
第5章面向Deep Web的搜索引擎原型系统设计	第52-65页
·系统背景	第52-53页
·Deep Web的规模	第52-53页
·传统搜索引擎在Deep Web领域中的不足	第53页
·系统架构及工作流程设计	第53-55页
·系统模块设计	第55-63页
·Deep Web聚焦爬虫	第55-57页
·Web数据对象抽取子系统	第57-59页
·系统结构	第57-58页
·工作流程	第58-59页
·Web数据对象集成子系统	第59-61页
·系统结构	第59页
·工作流程	第59-61页
·分词器	第61-62页
·索引管理器	第62页
·查询处理器	第62-63页
·结果处理器	第63页
·本章小结	第63-65页
第6章实验结果及分析	第65-74页
·Web数据对象自动抽取实验	第65-69页
·测试数据集	第65页
·评价方法	第65-67页
·实验结果及分析	第67-69页
·Web数据对象集成实验	第69-73页
·测试数据	第69页
·评价方法	第69-70页
·实验结果及分析	第70-73页
·海量Web数据对象的组织实验	第73页
·本章小结	第73-74页
第7章总结与展望	第74-77页
·工作总结	第74-75页
·展望未来	第75-77页
参考文献	第77-83页
攻读学位期间公开发表的论文与参与的科研项目	第83-84页
致谢	第84-85页
详细摘要	第85-87页