Deep Web搜索引擎的关键技术
| 摘要 | 第1-6页 |
| Abstract | 第6-11页 |
| 第一章 绪论 | 第11-14页 |
| ·研究背景 | 第11页 |
| ·研究现状 | 第11-12页 |
| ·目的和意义 | 第12-13页 |
| ·论文内容和结构 | 第13-14页 |
| 第二章 搜索引擎概述 | 第14-18页 |
| ·一般原理 | 第14-16页 |
| ·信息采集模块 | 第14-15页 |
| ·分析索引模块 | 第15页 |
| ·检索模块 | 第15-16页 |
| ·性能评价指标 | 第16页 |
| ·几种常见类别 | 第16-17页 |
| ·本章小结 | 第17-18页 |
| 第三章 Deep Web概述 | 第18-24页 |
| ·Deep Web出现原因 | 第18页 |
| ·定义及类型 | 第18-19页 |
| ·Deep Web概况 | 第19-20页 |
| ·发展 Deep Web搜索引擎的必要性和可行性 | 第20-21页 |
| ·Deep Web搜索引擎的框架及关键技术 | 第21-23页 |
| ·本章小结 | 第23-24页 |
| 第四章 数据库自动发现 | 第24-29页 |
| ·相关研究 | 第24-25页 |
| ·爬行规则优化 | 第25页 |
| ·搜索界面识别 | 第25-26页 |
| ·元信息提取 | 第26-27页 |
| ·实验及讨论 | 第27-28页 |
| ·本章小结 | 第28-29页 |
| 第五章 数据库自动选择 | 第29-37页 |
| ·简介 | 第29页 |
| ·粗略法 | 第29-30页 |
| ·相似度计算法 | 第30-31页 |
| ·学习法 | 第31-33页 |
| ·基于短查询的方法 | 第33页 |
| ·数据库代表获取 | 第33-34页 |
| ·基于多参数的自动选择方法 | 第34-35页 |
| ·本章小结 | 第35-37页 |
| 第六章 返回结果自动抽取 | 第37-45页 |
| ·Web页面信息抽取的相关研究 | 第37-39页 |
| ·识别潜在记录块 | 第39-41页 |
| ·基于分隔符的记录识别法 | 第39页 |
| ·基于节点相似度的记录块识别法 | 第39-40页 |
| ·识别潜在记录块的步骤 | 第40-41页 |
| ·识别结果记录块 | 第41页 |
| ·识别后续链接块 | 第41-42页 |
| ·Wrapper构造 | 第42页 |
| ·试验及讨论 | 第42-44页 |
| ·本章小结 | 第44-45页 |
| 第七章 结果聚合 | 第45-49页 |
| ·结果聚合面临的问题 | 第45页 |
| ·候选结果选择 | 第45-47页 |
| ·结果全局排序 | 第47-48页 |
| ·结果消重 | 第48页 |
| ·本章小结 | 第48-49页 |
| 第八章 结论 | 第49-51页 |
| 参考文献 | 第51-56页 |
| 攻读硕士学位期间发表的论文 | 第56页 |