Web数据库采样技术研究

摘要	第5-7页
Abstract	第7-8页
第1章绪论	第11-17页
1.1 研究背景	第11-12页
1.2 问题的提出及意义	第12-13页
1.3 本文主要的工作	第13-15页
1.4 本文组织结构	第15-17页
第2章 Web数据库采样方法概述	第17-29页
2.1 Web数据库采样方法	第17-23页
2.1.1 双层伯努利模型	第17-18页
2.1.2 Hidden-DB-Sampler	第18-19页
2.1.3 WDB-Sampler	第19-20页
2.1.4 Probability-Based-Sampler	第20-21页
2.1.5 NU-HDB-Sampler	第21-22页
2.1.6 Keyword-Based-DB-Sampler	第22-23页
2.2 Deep Web数据提取方法	第23-25页
2.3 Web信息抽取技术	第25-26页
2.4 中文分词技术	第26-28页
2.5 本章小结	第28-29页
第3章一种新的Web数据库采样方法-RFSampler	第29-43页
3.1 相关符号定义及预备知识	第29-32页
3.2 采样方法的评价体系	第32-35页
3.2.1 样本质量	第32-34页
3.2.2 采样代价	第34-35页
3.3 系统模型	第35-37页
3.4 系统流程	第37-42页
3.4.1 预处理阶段	第38-40页
3.4.2 查询条件的生成	第40-41页
3.4.3 采样终止条件	第41页
3.4.4 采样方法评价	第41-42页
3.5 本章小结	第42-43页
第4章基于属性相关度的查询模式	第43-51页
4.1 相关概念	第43-44页
4.2 相关工作	第44-46页
4.3 属性相关度	第46-47页
4.4 查询模式	第47-48页
4.5 基于属性相关度的查询模式	第48-50页
4.6 本章小结	第50-51页
第5章基于词频-属性值相关度的查询条件生成策略	第51-59页
5.1 相关概念	第51-52页
5.2 相关工作	第52-53页
5.3 词频分析	第53-54页
5.4 属性值相关度	第54-56页
5.5 基于词频-属性值相关度的查询条件生成策略	第56-58页
5.6 本章小结	第58-59页
第6章实验分析及总结	第59-69页
6.1 实验结果及分析	第59-67页
6.1.1 实验的硬件和软件	第59-60页
6.1.2 实验结果及分析	第60-67页
6.2 本章小结	第67-69页
第7章结论	第69-71页
参考文献	第71-73页
致谢	第73-75页
攻读硕士学位期间发表的论文和参加的项目	第75页