首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于树结构的网页数据自动抽取方法的研究与实现

目录第1-7页
第一章 导论第7-10页
   ·网页数据抽取技术产生的背景第7-8页
   ·本文研究的问题第8页
   ·本文组织结构第8-10页
第二章 Web数据抽取技术概述第10-17页
   ·Web挖掘面临的问题第10-11页
   ·什么是包装器第11-12页
   ·包装器生成系统的发展及分类第12-14页
   ·几种基于HTML 结构特征的工具第14-16页
   ·本章小结第16-17页
第三章 网页预处理中几个关键问题的分析与研究第17-32页
   ·问题的定义第17-19页
   ·关于系统中各种文档的分析第19-24页
     ·HTML网页面临的问题第19-20页
     ·XHTML的优势第20-21页
     ·文档对象模型(DOM)第21-24页
   ·关于HTML文档的形式化定义第24-29页
   ·网页预处理子系统第29-31页
     ·HTML页面转换为XHTML文档的工具第29页
     ·网页净化方法第29-31页
   ·本章小结第31-32页
第四章 基于树结构的包装器自动生成算法研究与实现第32-56页
   ·包装器生成算法的研究与实现第32-48页
     ·模板推导问题的研究第32-35页
     ·包装器生成算法第35-41页
     ·关于DTAWE算法的讨论第41-42页
     ·关于DTAWE算法的实现第42-48页
   ·语义标识算法的设计与实现第48-51页
     ·问题定义第48-49页
     ·语义标识算法第49-50页
     ·语义标识算法的实现第50-51页
   ·数据抽取算法的研究与实现第51-53页
     ·使用XML描述包装器第51-52页
     ·数据抽取过程第52-53页
   ·运行环境及测试结果第53-54页
     ·运行环境第53页
     ·测试结果第53-54页
   ·本章小结第54-56页
第五章 总结与展望第56-58页
   ·全文总结第56页
   ·下一步工作第56-58页
参考文献第58-61页
摘要第61-63页
Abstract第63-66页
致谢第66-67页
导师及作者简介第67页

论文共67页,点击 下载论文
上一篇:外贴碳纤维布加固受弯钢筋混凝土梁的试验研究与理论分析
下一篇:企业资产证券化融资研究