首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向deep web的数据抽取与结果聚合技术研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-19页
   ·研究背景及意义第10-11页
   ·deep web 概述以及 deep web 数据集成第11-14页
   ·数据抽取技术的研究现状第14-17页
     ·基于 HTML 结构化特征的抽取工具第14-15页
     ·页面抽取语言第15页
     ·基于模式的抽取工具第15-16页
     ·基于本体的数据抽取方式第16页
     ·自动抽取工具第16页
     ·其他方法第16-17页
   ·本文的研究内容与创新点第17页
     ·本文的研究内容第17页
     ·本文的创新点第17页
   ·论文的结构第17-19页
第2章 相关标准与技术介绍第19-28页
   ·网页的基本结构与解析技术第19-22页
     ·HTML第19-20页
     ·XML第20页
     ·HTML 转换技术第20-21页
     ·DOM第21-22页
   ·搜索引擎概述第22-23页
   ·ICTCLAS 分词第23-24页
   ·网页聚类第24-25页
     ·网页聚类相关概念第24页
     ·网页聚类相关技术第24-25页
   ·文档结构的相似计算模型第25-27页
     ·元素比较模型第25页
     ·树的编辑距离第25-27页
     ·标签树路径模型第27页
   ·本章小结第27-28页
第3章 Deep web 数据自动抽取与结果聚合第28-53页
   ·MDR第28-31页
   ·基于标签树结构相似度的 Deep web 数据自动抽取第31-39页
     ·HTML 页面预处理第31-35页
     ·基于标签树结构相似度的数据记录挖掘第35-39页
   ·基于树路径与子树匹配的标签树结构相似度计算第39-46页
     ·子树-路径模型第39-40页
     ·标签树路径公共子序列第40-41页
     ·子标签树路径相似度第41-42页
     ·子标签树相似度第42-44页
     ·标签树相似度第44-46页
   ·基于子树不完全匹配的 Deep web 数据自动抽取第46-50页
   ·结果聚合第50-51页
   ·本章小结第51-53页
第4章 实验与结果分析第53-59页
   ·实验结果评价标准第53-54页
   ·开发环境第54页
   ·实验设置第54-55页
   ·实验结果第55-57页
     ·数据抽取实验结果第55-56页
     ·结果聚合实验结果第56-57页
   ·实验结果分析第57页
     ·数据抽取结果分析第57页
     ·结果聚合结果分析第57页
   ·本章总结第57-59页
结论第59-60页
参考文献第60-64页
攻读硕士学位期间发表的论文和取得的科研成果第64-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:面向服务的网络态势评估方法研究
下一篇:在线网络社区结构发现与演化技术研究