首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

增量式Deep Web数据获取技术研究

摘要第1-5页
Abstract第5-11页
第一章 绪论第11-17页
   ·研究背景第11-13页
   ·研究意义第13-14页
   ·主要研究内容第14-15页
   ·本文组织第15-17页
第二章 数据获取技术综述第17-27页
   ·Deep Web 信息集成架构第17-19页
   ·相关研究工作第19-21页
     ·Deep Web 数据源发现与分类技术研究现状第19页
     ·Deep Web 数据标注技术研究现状第19-20页
     ·Deep Web 增量获取技术研究现状第20-21页
   ·传统搜索引擎的数据获取方法第21-23页
     ·传统Web 爬虫的工作流程第21-22页
     ·传统Web 爬虫的搜索策略第22页
     ·传统Web 爬虫的更新方式第22-23页
   ·传统搜索引擎在Deep Web 领域的不足第23-24页
   ·Deep Web 中的数据获取技术第24-26页
     ·基于URL 的Deep Web 数据获取方式第24页
     ·基于查询词的Deep Web 数据获取方式第24-25页
     ·Deep Web 的增量获取方式第25页
     ·Deep Web 数据获取中的关键问题第25-26页
   ·本章小结第26-27页
第三章 Deep Web 数据源发现及分类方法第27-40页
   ·数据源发现第27-29页
     ·表单聚焦爬虫第27-29页
   ·数据源判定第29-30页
   ·数据源分类第30-36页
     ·特征提取第32-34页
     ·数据源分类方法第34-36页
       ·知识库的建立第34-35页
       ·分类算法第35-36页
   ·实验第36-39页
     ·查询词与检索结果的相关性验证第36-38页
     ·数据源判定验证第38页
     ·数据源分类方法验证第38-39页
   ·本章小结第39-40页
第四章 数据抽取与标注第40-52页
   ·引言第40页
   ·Web 记录的抽取第40-43页
   ·数据标注模型第43-47页
     ·线性链条件随机场第43-44页
     ·混合条件随机场第44-45页
     ·二维混合条件随机场第45-47页
   ·数据标注第47页
   ·对包含数据记录的文本块建模第47-49页
   ·实验第49-51页
     ·实验数据第49页
     ·评价标准第49-50页
     ·实验结果及效率分析第50-51页
   ·结论第51-52页
第五章 Deep Web 数据增量获取策略第52-68页
   ·概述第52-53页
   ·Deep Web 数据源的变化频率研究第53-54页
   ·数据变化模型第54-55页
   ·Deep Web 表单提交第55-57页
     ·查询词选择第56-57页
   ·增量获取第57-66页
     ·评价指标第57-59页
     ·WDB 建模第59-60页
     ·朴素的增量获取策略第60-61页
     ·基于采样的增量获取策略第61-66页
       ·采样的代价第61页
       ·资源分配策略第61-62页
       ·样本选取第62页
       ·样本数量与效率第62-64页
       ·自动调整样本数量第64-65页
       ·基于查询词的资源分配策略第65-66页
   ·实验第66-67页
   ·本章小结第67-68页
第六章 总结与展望第68-71页
   ·工作总结第68-69页
   ·特色与创新第69-70页
   ·工作展望第70-71页
参考文献第71-78页
攻读学位期间公开发表的论文与科研项目第78-79页
致谢第79-80页

论文共80页,点击 下载论文
上一篇:基于特征分析的DDoS攻击检测技术研究
下一篇:基于Flex与J2EE的族谱网的设计与实现