首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于XML用户自定义需求的WEB信息提取研究

目录第1-5页
图目录第5-6页
表目录第6-7页
摘要第7-9页
Abstract第9-11页
第1章 绪论第11-15页
   ·研究背景及意义第11-12页
   ·国内外研究现状第12-13页
     ·国外研究现状第12页
     ·国内研究现状第12-13页
     ·目前研究成果的不足第13页
   ·研究主要内容和研究目标第13-14页
   ·文章的组织结构第14-15页
第2章 WEB信息提取相关技术第15-27页
   ·XML及相关标准第15-20页
     ·XML第15-16页
     ·DOM第16-17页
     ·XSL第17-20页
   ·WEB信息提取技术概述第20-25页
     ·WEB信息提取与信息检索的区别第20页
     ·WEB信息提取的分类第20-24页
     ·WEB信息提取评价标准第24-25页
   ·本章小结第25-27页
第3章 系统设计思路和获取待提取页面第27-37页
   ·研究概述第27-31页
     ·基本设计思想第27-30页
     ·WEB信息提取数据源第30-31页
   ·页面预处理第31-33页
     ·页面清洗第31-32页
     ·XHTML转换为XML第32-33页
   ·解析生成DOM树第33-36页
     ·标记节点类型第33-34页
     ·获取节点路径表达式第34-36页
   ·本章小结第36-37页
第4章 获取用户需求和构造提取规则第37-51页
   ·定义目标结构第37-39页
     ·概念描述第37页
     ·构造目标结构第37-39页
   ·标记样本第39-41页
     ·内容映射第39-40页
     ·结构映射第40-41页
     ·样本数据映射规则第41页
   ·构造提取规则第41-48页
     ·根节点存在结构映射第43-46页
     ·根节点不存在结构映射第46-48页
   ·本章小结第48-51页
第5章 实验与分析第51-59页
   ·实验设计第51-52页
     ·实验环境第51页
     ·实验数据源第51页
     ·实验内容第51-52页
   ·实验评估第52-55页
     ·简单规则提取第52-54页
     ·复杂规则提取第54-55页
   ·原型系统演示第55-58页
   ·本章小结第58-59页
第6章 总结第59-61页
   ·工作总结第59页
   ·未来工作第59-61页
参考文献第61-65页
附录一第65-69页
附录二第69-73页
致谢第73-75页
攻读学位期间所发表的学术论文第75页

论文共75页,点击 下载论文
上一篇:基于用户情境的论坛个性化推荐模型研究
下一篇:一种基于面向方面的可信软件非功能需求设计与评估方法