首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于XML的半结构化Web信息提取的研究

第一章 绪论第1-15页
   ·选题背景和意义第8-9页
   ·半结构化数据第9页
   ·什么是信息提取第9-11页
   ·信息提取研究的发展历史第11-13页
   ·Web 信息提取的应用第13-14页
   ·本文的研究内容第14页
   ·本文的组织第14-15页
第二章 相关标准与 Web 信息提取技术第15-34页
   ·引言第15页
   ·相关标准第15-20页
     ·XML第15-18页
     ·XHTML第18页
     ·DOM第18-19页
     ·Xpath第19页
     ·XSLT第19-20页
   ·Web 信息提取技术概述第20-32页
     ·Web 信息提取技术的分类第21-26页
     ·信息提取系统体系结构第26-28页
     ·Web 信息提取存在的问题第28页
     ·Web 信息提取的关键技术第28-31页
     ·信息提取系统的评测指标第31-32页
   ·资料综述第32-33页
   ·本章总结第33-34页
第三章 基于 XML 的半结构化 Web 信息提取平台第34-60页
   ·概述第34-38页
     ·平台的目标第34页
     ·设计的基本思想第34-35页
     ·XML 和 XSLT 在平台中的角色第35-38页
     ·数据导向型页面第38页
   ·平台的总体框架第38-39页
   ·平台中的知识库与数据库第39-41页
     ·构造领域知识库第39-40页
     ·提取规则库第40页
     ·提取结果数据库和 Web 页面数据库第40-41页
   ·页面优化模块第41-48页
     ·清洗(TIDY)页面文档第41-47页
     ·页面解析(PARSER)第47-48页
   ·信息提取模块第48-58页
     ·规则学习的依据第49-50页
     ·规则学习的步骤第50-56页
     ·信息提取过程的描述第56-58页
   ·资料综述第58页
   ·本章总结第58-60页
第四章 提取规则的优化研究第60-66页
   ·信息定位的优化方法第60-63页
     ·基于树路径的定位第60-61页
     ·路径与内容结合的定位方式第61-62页
     ·完全基于文本的定位方式第62-63页
     ·基于属性的定位第63页
   ·几种定位方法的小结第63-65页
   ·本章总结第65-66页
第五章 结论和展望第66-68页
   ·本论文研究总结第66-67页
   ·展望第67-68页
致谢第68-69页
参考文献第69-72页
攻读学位期间的研究成果及发表的学术论文第72页

论文共72页,点击 下载论文
上一篇:γ-氨基丁酸转运蛋白亚型Ⅰ(GAT1)基因剔除小鼠系的建立与表型分析
下一篇:企业知识博客系统研究及在知识管理中的应用