首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于树结构的Deep Web数据抽取研究

摘要第1-4页
Abstract第4-5页
目录第5-8页
第一章 绪言第8-14页
   ·选题的背景第8页
   ·国内外研究现状第8-11页
   ·本文研究内容第11-12页
   ·本文的组织第12-14页
第二章 关于Web数据抽取技术相关概述第14-20页
   ·Web数据抽取技术第14-15页
   ·Web数据抽取技术的分类第15-20页
     ·基于自然语言理解方式的数据抽取第15-16页
     ·基于分装器归纳方式的数据抽取第16-17页
     ·基于Ontology方式的数据抽取第17-18页
     ·基干HTML结构的数据抽取第18-20页
第三章 相关标准第20-38页
   ·HTML(Hyper Text markup Language)第20-25页
     ·HTML标签第20-25页
   ·XML第25-32页
     ·XML的产生第27-28页
     ·XML语法第28-29页
       ·XML文档第28-29页
     ·元素(Element)与标记(Tag)第29-30页
     ·属性(Attribute)第30页
     ·XML验证(Validation)第30-32页
       ·DTD第30-31页
       ·模式第31-32页
     ·样式单第32页
   ·XHTML第32-33页
   ·DOM(Document Object Model)第33页
   ·XPath第33-35页
   ·XSLT第35-38页
第四章 网页预处理第38-47页
   ·HTML文档清理第38-41页
     ·HTML向XHTML的转换第39-41页
   ·文档解析成树结构第41-44页
     ·文档对象模型(DOM)第41-44页
   ·Web网页噪声去除第44-47页
     ·树过滤第45-47页
第五章 基于树结构的Deep Web数据抽取第47-64页
   ·系统设计第47-50页
     ·系统的总体框架第47-49页
     ·基本设计思想第49-50页
   ·抽取规则生成第50-58页
     ·方法概述第50页
     ·抽取规则生成第50-58页
       ·自顶向下树匹配算法第50-55页
         ·自顶向下树匹配第50-51页
         ·匹配算法第51-55页
       ·数据块定位第55-57页
       ·生成抽取规则第57-58页
   ·Web数据抽取第58-60页
     ·Web数据抽取第58页
     ·Web数据抽取结果第58-60页
   ·XML文档的存储第60-64页
     ·XML文档存储的常用方法第60-61页
     ·XML到关系数据库映射的现状第61页
     ·XML文档的存储第61-64页
第六章 总结与展望第64-65页
   ·本文工作的总结第64页
   ·工作展望第64-65页
致谢第65-66页
参考文献第66-69页
攻读学位期间发表论文情况第69页

论文共69页,点击 下载论文
上一篇:IID3算法在CRM客户分类中的应用与研究
下一篇:中小城镇和谐性街道景观的构建--以遂宁市部分路段街道景观整合为例