首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Web结构的表格信息抽取研究

摘要第1-6页
ABSTRACT第6-7页
致谢第7-11页
第一章 引言第11-15页
   ·课题研究背景、目的与意义第11-12页
     ·课题研究的背景第11-12页
     ·课题研究的目的第12页
     ·课题研究的意义第12页
   ·本文的工作第12-13页
   ·课题来源第13页
   ·论文内容组织安排第13-15页
第二章 Web 表格信息抽取技术第15-30页
   ·Web 信息抽取技术第15-16页
   ·Web 信息抽取系统介绍第16-22页
   ·三个比较信息抽取系统的指标第22-25页
     ·任务的困难第22-23页
     ·使用的技术第23-24页
     ·自动化程度第24-25页
   ·Web 表格信息抽取及发展第25-26页
   ·Web 表格信息抽取技术第26-29页
     ·Web 表格信息抽取方法第26页
     ·Web 表格信息抽取国内外研究现状第26-29页
   ·本章小结第29-30页
第三章 一种基于路径模式挖掘的 Web 表格抽取方法第30-38页
   ·网页对应 DOM 树的建立第30-32页
   ·基于路径模式的 Web 表格抽取方法第32-34页
   ·实验结果及抽取系统介绍第34-37页
   ·本章小结第37-38页
第四章 基于树编辑距离的网页信息抽取算法 EtractDRs第38-46页
   ·总体过程概要第38页
   ·问题描述及相关定义第38-41页
   ·基于树编辑距离计算的数据域抽取算法第41-45页
     ·数据域抽取算法 EtractDRs第41-43页
     ·候选泛化节点间树编辑距离算法 TED 描述第43-44页
     ·自上而下的树编辑距离计算方法 TDTreeEditDist第44-45页
   ·本章小结第45-46页
第五章 实验结果与分析第46-55页
   ·实验环境第46页
   ·实验语料及语料预处理第46页
     ·实验语料第46页
     ·语料预处理第46页
   ·评价指标第46页
   ·参数设置第46-47页
   ·实验结果第47-54页
   ·实验结果分析第54页
   ·本章小结第54-55页
第六章 总结与展望第55-57页
   ·工作总结第55页
   ·工作展望第55-57页
参考文献第57-61页
附录一 研究生期间主要科研工作及成果第61-62页

论文共62页,点击 下载论文
上一篇:基于网络安全因素的数据融合方法的研究
下一篇:智能压路机控制系统的研究