首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于网页结构的Web数据抽取方法研究

摘要第1-5页
Abstract第5-8页
第一章 绪论第8-12页
   ·本课题的研究背景和意义第8页
   ·Web 数据抽取技术的发展历史第8-9页
   ·研究现状第9-11页
   ·研究目标与工作第11页
   ·内容安排第11-12页
第二章 相关知识介绍第12-23页
   ·SGML 介绍第12-13页
   ·HTML 介绍第13-14页
     ·HTML 简介第13页
     ·HTML 标签第13-14页
     ·HTML 特点第14页
   ·XML 介绍第14-17页
     ·XML 的产生第14-15页
     ·XML 的特点第15-16页
     ·XML 的主要相关技术第16-17页
   ·DOM 介绍第17-18页
   ·XSL 介绍第18-19页
   ·XPath 介绍第19-20页
   ·HTTP 介绍第20-21页
   ·Web 数据抽取模型及相关步骤介绍第21-22页
   ·本章小结第22-23页
第三章 基于HTML 的Web 数据抽取第23-29页
   ·基于HTML 的解析原理第23页
   ·Java第23-24页
   ·正则表达式及其匹配第24页
   ·抽取算法第24-25页
   ·系统实现结构第25-26页
   ·系统运行结果第26-28页
   ·本章小结第28-29页
第四章 基于XML 的Web 数据抽取第29-39页
   ·基于HTML 的Web 数据抽取方法的不足第29页
   ·基于XML 的Web 数据抽取过程与原理第29-30页
   ·将HTML 转化为XHTML第30-31页
   ·在javascript 中创建DOM 文档对象并装载XML第31-32页
   ·针对特定网页构建XSLT 映射文件第32-35页
   ·基于DOM 的采用XSLT 表示的网页映射方法第35-38页
   ·本章小结第38-39页
第五章 实验结果与分析第39-44页
   ·针对单一网页抽取的实验结果比较第39-40页
   ·针对特定内容(新闻)的抽取实验结果第40-43页
   ·本章小结第43-44页
第六章 相关工作第44-46页
第七章 总结与展望第46-48页
   ·主要成果与创新点第46页
   ·展望第46-48页
参考文献第48-51页
致谢第51-52页
附录A 攻读学位其间发表的论文第52页

论文共52页,点击 下载论文
上一篇:基于数据挖掘方法寿险业务管理KPI指标分析
下一篇:可重构嵌入式虚拟仪器的设计方法研究