首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于XML的Deep Web信息抽取系统的研究与初步实现

1 第一章 概述第1-12页
   ·引言第9-10页
     ·背景第9页
     ·隐蔽网络第9-10页
     ·网页信息抽取第10页
   ·本文的工作第10-11页
   ·本文的组织第11-12页
2 第二章 相关研究第12-17页
   ·相关研究第12-15页
   ·研究总结和本文的相关工作第15-17页
3 第三章 相关标准第17-26页
   ·HTML(Hyper Text Markup Language)第17页
   ·XML第17-19页
   ·XHTML第19-20页
   ·XPath第20-24页
   ·XSLT第24-26页
4 第四章 网页信息抽取中所要解决的两个基本问题第26-35页
   ·HTML向XHTML的转换第26-29页
   ·中文内码的同步更新第29-35页
     ·HTML网页转换为XML格式文档的中文问题解决办法第30-31页
     ·XML文档进行格式转换或数据输入、输出时的中文解决办法第31-35页
5 第五章 基于XSLT网页抽取规则的分析与探讨第35-51页
   ·几种常用抽取规则的分析与比较第35-43页
     ·绝对路径抽取法第35-36页
     ·缩写路径抽取法第36-37页
     ·基于锚点的抽取方法第37-39页
     ·基于属性的抽取方法第39-40页
     ·基于单层扁平结构的抽取方法第40-43页
     ·不同抽取方法的比较第43页
   ·两类典型网页信息抽取模式的分析与示例第43-51页
     ·基于主题链接组信息抽取模式第43-48页
     ·基于多记录的表信息抽取模式第48-51页
6 第六章 表单提取器的构建与实现第51-72页
   ·表单的结构和特点第51-54页
     ·
表单标记
第51-52页
     ·表单输入标记第52-53页
     ·第53页
     ·第53页
     ·