首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于树匹配的交互式Web数据抽取技术的研究

第一章 绪论第1-11页
   ·研究背景第7-8页
   ·研究内容简介第8-9页
   ·论文内容及结构第9-11页
第二章 Web 数据抽取技术的发展第11-17页
   ·Web 数据抽取系统第11-13页
   ·Web 数据抽取的研究现状第13-17页
     ·数据抽取方法分类第13-16页
     ·存在的问题及不足第16-17页
第三章 基于子树匹配的交互式数据抽取方法第17-44页
   ·预备知识介绍第18-20页
     ·XHTML第18-19页
     ·DOM 对象第19页
     ·XPath第19-20页
   ·Web 文档与 DOM 树的对应第20-22页
   ·TSMDE 框架模型简介第22-23页
   ·模型中应用算法介绍第23-31页
     ·多序列比对算法第23-27页
     ·TOP-DOWN 树匹配算法第27-31页
   ·TSMDE 数据抽取流程第31-41页
     ·Web 文档处理转换第31-32页
     ·抽取规则生成第32-37页
     ·DOM 树的遍历和匹配第37-39页
     ·数据的析出和保存第39-41页
   ·Wrapper 的维护和更新第41-44页
第四章 数据抽取试验第44-52页
   ·数据抽取的度量指标第44-45页
   ·模型系统的开发第45-48页
   ·模型系统的试验结果第48-51页
   ·与其他的抽取方法比较第51-52页
第五章 总结和展望第52-54页
   ·本文的创新点第52页
   ·本文不足及进一步研究的方向第52-54页
附录:试验网站数据记录示例第54-56页
参考文献第56-60页
发表论文和科研情况说明第60-61页
致 谢第61页

论文共61页,点击 下载论文
上一篇:科龙电器股份有限公司营销渠道策略研究
下一篇:中国体育保险发展的初步思路