首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

Deep Web信息抽取系统的研究与实现

摘要第1-3页
Abstract第3-6页
第一章 绪论第6-10页
   ·研究的目的和意义第6-7页
   ·研究现状第7-8页
   ·本文研究内容第8页
   ·本文的创新点第8-9页
   ·本文组织结构第9-10页
第二章 Deep Web信息抽取的相关问题第10-18页
   ·Web信息抽取第10-12页
     ·信息抽取的发展第10-11页
     ·Web信息抽取第11-12页
   ·Deep Web信息抽取系统第12-13页
   ·响应页面的获取第13-14页
   ·Web页面第14-16页
     ·HTML第14-15页
     ·CSS第15-16页
     ·脚本第16页
   ·页面预处理第16-18页
第三章 基于XML的 Web信息抽取第18-32页
   ·XML及其相关技术第18-22页
     ·XML概述第18-20页
     ·XSL与 XSLT转换第20-21页
     ·Xpath第21-22页
   ·基于 XML的 Web信息抽取第22-23页
   ·Web页面清理第23-27页
     ·页面清理的对象第23-26页
     ·页面清理规则第26-27页
   ·HTML到 XML转换第27-29页
   ·通过 XSLT抽取信息第29-32页
     ·编写 XSLT样式表第29-30页
     ·XSLT处理第30-32页
第四章 Web页面自动抽取算法第32-44页
   ·基于页面分块的 Web页面抽取算法第32-33页
   ·Web页面分块第33-36页
     ·CSS盒模型第34页
     ·页面分块第34-36页
   ·数据区域识别第36-38页
     ·数据区域定义第36-37页
     ·数据区域识别算法第37-38页
   ·数据项提取第38-43页
     ·块之间的相似度第38-41页
     ·根据块间相似度的数据项提取第41-43页
   ·算法实验与分析第43-44页
第五章 Deep Web信息抽取系统实现第44-52页
   ·Deep Web信息抽取系统设计方案第44-47页
     ·Web信息抽取系统的评价第44页
     ·不同的Web信息抽取方式第44-45页
     ·可伸缩的Deep Web信息抽取系统设计方案第45-47页
   ·原型系统的实现第47-50页
     ·系统总体结构第47-48页
     ·任务管理模块第48页
     ·规则管理模块第48-50页
     ·页面处理模块第50页
   ·本文研究的应用第50-52页
第六章 总结与展望第52-54页
   ·本文研究工作总结第52-53页
   ·下一步工作展望第53-54页
致谢第54-55页
主要参考文献第55-58页
附录一第58-59页
附录二第59-60页

论文共60页,点击 下载论文
上一篇:基于行为时序逻辑模型检测的研究与应用
下一篇:数字水印在印刷品中的应用与研究