首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于XML的Web信息抽取设计与实现

中文摘要第1-4页
英文摘要第4-7页
1 绪论第7-11页
   ·论文选题的背景及意义第7页
   ·国内外现状综述第7-9页
   ·论文的内容及组织第9-11页
2 XML 技术标准与 Web 信息抽取技术第11-24页
   ·XML 技术标准第11-16页
     ·XML 技术介绍第11-14页
     ·XHTML第14-15页
     ·DOM第15页
     ·XSLT第15-16页
   ·Web 信息抽取技术介绍第16-23页
     ·Web 信息抽取技术概述第16-17页
     ·Web 信息抽取技术的分类第17-22页
     ·Web 信息抽取的应用第22页
     ·信息抽取系统的评测指标第22-23页
   ·本章小结第23-24页
3 基于 XML 的 Web 信息抽取方法第24-37页
   ·引言第24页
   ·现有的Web 页面信息抽取的相关方法第24-27页
     ·手工方式的信息抽取第24-25页
     ·半自动化的信息抽取第25-26页
     ·自动(基于规则)的信息抽取第26-27页
   ·基于树型结构的Web 数据抽取规则第27-31页
     ·用树型结构表示Web 文档第27页
     ·算法总体思路第27-30页
     ·抽取数据的XML 输出第30-31页
   ·XML 的数据访问机制第31-36页
     ·XML 数据岛第31-32页
     ·使用DOM 访问XML 文档第32-36页
   ·本章小结第36-37页
4 XML 信息抽取的健壮性第37-46页
   ·引言第37页
   ·问题描述第37-38页
   ·健壮性标准第38-39页
   ·区域定位第39-43页
     ·使用唯一的ID第39页
     ·搜索相似上下文第39-40页
     ·遍历树节点第40-43页
   ·数据映射以及合并第43-44页
     ·数据映射第43-44页
     ·数据合并第44页
   ·本章小结第44-46页
5 信息抽取原型系统的设计与实现第46-54页
   ·需求分析第46-48页
     ·基于规则的自动抽取第46-47页
     ·基于人工的手动抽取第47页
     ·系统用例设计及分析第47-48页
   ·原型系统总体框架设计第48-51页
     ·系统功能模块设计第48-49页
     ·系统体系结构设计第49页
     ·功能模块的介绍第49-51页
   ·原型系统的实现及评价第51-53页
     ·系统实现环境第51-52页
     ·原型系统评价策略第52-53页
   ·本章小结第53-54页
6 结论第54-56页
   ·论文总结第54页
   ·工作展望第54-56页
致谢第56-57页
参考文献第57-60页
附录 部分模块程序代码第60-62页
作者在攻读硕士学位期间发表及录用的论文目录第62页

论文共62页,点击 下载论文
上一篇:腰交感神经解剖及腰椎间盘痛觉传导通路的相关研究
下一篇:股东大会决议不成立探究