首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于XML的Web数据抽取技术的研究

摘要第1-4页
ABSTRACT第4-7页
第一章 绪论第7-13页
 1.1 背景第7-8页
  1.1.1 数据抽取概念第7页
  1.1.2 Web为数据抽取带来的挑战第7-8页
 1.2 XML为Web数据抽取带来新的希望第8-9页
 1.3 基于XML的Web数据抽取技术的研究第9-10页
 1.4 研究方案第10-12页
  1.4.1 研究目标第10页
  1.4.2 研究思路第10页
  1.4.3 研究内容第10-11页
  1.4.4 研究意义第11-12页
 1.5 创新之处第12页
 1.6 论文组织结构第12-13页
第二章 获取Web数据源策略第13-24页
 2.1 引言第13页
 2.2 广域Web搜索第13-17页
  2.2.1 广域Web链接结构分析第13-14页
  2.2.2 广域Web搜索经典算法第14-16页
  2.2.3 广域Web搜索总结第16-17页
 2.3 小范围Web搜索第17-21页
  2.3.1 研究背景第17-18页
  2.3.2 小范围Web链接结构第18-19页
  2.3.3 改进的HITS算法(m-HITS)第19-21页
 2.4 实验及其分析第21-23页
 2.5 本章小结第23-24页
第三章 基于XML的Web数据转换算法第24-39页
 3.1 引言第24页
 3.2 相关工作第24-26页
 3.3 问题描述第26-27页
 3.4 基于栈结构的HTML到XML转换算法第27-30页
  3.4.1 方法规划第27-28页
  3.4.2 消除HTML的不严格语法第28-29页
  3.4.3 输出XML文件第29-30页
 3.5 实验及其分析第30-38页
  3.5.1 定义数据结构第30-31页
  3.5.2 实现栈算法第31-37页
  3.5.3 运行结果第37-38页
 3.6 本章小结第38-39页
第四章 健壮的XML数据抽取方法第39-50页
 4.1 引言第39页
 4.2 问题描述第39-40页
 4.3 健壮性标准第40-41页
 4.4 区域定位第41-48页
  4.4.1 使用唯一的ID第41页
  4.4.2 搜索相似上下文第41-42页
  4.4.3 遍历树节点第42-48页
 4.5 数据映射以及合并第48-49页
  4.5.1 数据映射第48-49页
  4.5.2 数据合并第49页
 4.6 本章小结第49-50页
第五章 原型系统的实现第50-61页
 5.1 引言第50页
 5.2 总体设计第50-53页
  5.2.1 相关技术第50-52页
  5.2.2 总体规划第52-53页
 5.3 详细设计第53-57页
  5.3.1 浏览端程序第53-56页
  5.3.2 转换程序第56页
  5.3.3 映射程序第56-57页
 5.4 运行结果第57-60页
 5.5 本章小结第60-61页
第六章 总结与展望第61-63页
 6.1 论文总结第61页
 6.2 未来工作展望第61-63页
参考文献第63-67页
致谢第67-68页
主要研究成果第68页

论文共68页,点击 下载论文
上一篇:保险法告知义务法律问题探析
下一篇:赵本山小品中幽默的预设研究