首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于XML的Web信息抽取技术研究

摘要第1-6页
Abstract第6-9页
第一章 绪论第9-13页
   ·课题研究的背景和意义第9-10页
   ·国内外研究现状与分析第10-11页
     ·国外Web信息抽取现状第10-11页
     ·国内Web信息抽取现状第11页
   ·论文的研究内容第11-12页
   ·论文的组织结构第12-13页
第二章 Web信息抽取方法第13-21页
   ·Web信息抽取方法概述第13页
   ·Web信息抽取的分类第13-20页
     ·基于自然语言理解方式的信息抽取第13-14页
     ·基于包装器归纳方式的样本学习第14-16页
     ·基于Ontology方式的信息抽取第16-17页
     ·基于HTML结构的信息抽取第17-19页
     ·基于Web查询方式的信息抽取第19-20页
   ·本章小结第20-21页
第三章 基于XML的Web信息抽取技术第21-32页
   ·HTML、XHTML与XML第21-26页
     ·HTML第21-22页
     ·XHTML第22页
     ·XML第22-26页
   ·XPath、XSLT第26-29页
     ·XPath第26-27页
     ·XSLT第27-29页
   ·XML DOM模型第29-31页
   ·本章小结第31-32页
第四章 基于XML的Web信息抽取模型第32-42页
   ·基于Web的信息抽取面临的问题第32-33页
   ·信息抽取目标第33页
   ·样本网页的获取第33-38页
     ·相似页面的意义第33-34页
     ·基于URL结构比较法第34-35页
     ·基于子树最优自由匹配第35-38页
   ·Web信息抽取模型第38-41页
     ·Web信息抽取思路第38-39页
     ·Web信息抽取流程第39-41页
   ·本章小结第41-42页
第五章 基于XML的Web信息抽取系统的实现第42-57页
   ·数据采集第42-43页
   ·页面预处理第43-48页
     ·页面清洗第44-46页
     ·页面解析第46-48页
   ·生成抽取规则第48-55页
     ·利用JTree显示DOM树第49-50页
     ·生成XPath表达式第50-52页
     ·抽取模板XSLT第52-53页
     ·Web信息抽取第53-55页
   ·系统性能评估第55-56页
   ·本章小结第56-57页
第六章 总结与展望第57-59页
   ·总结第57页
   ·展望第57-59页
参考文献第59-62页
攻读硕士学位期间发表的学术论文第62-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:BEMD分解方法及其在图像处理中的应用研究
下一篇:改进AOP技术在软件开发中的应用与研究