首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序语言、算法语言论文

基于XML的网页结构复用及抽取方法研究

摘要第1-6页
Abstract第6-9页
第一章 前言第9-13页
   ·问题的提出第9-10页
   ·研究背景及研究现状第10-12页
   ·本文的内容和主要工作第12-13页
第二章软件复用及XML相关技术第13-26页
   ·软件复用技术第13-16页
     ·组件第14-15页
     ·框架第15-16页
   ·Web 表现层技术第16-20页
     ·Web 表现层开发技术现状第16-19页
     ·表现层框架开发技术的概况第19-20页
   ·HTTP 技术第20-21页
     ·HTTP 协议的运作方式第20页
     ·HTTP HEADER第20-21页
   ·HTML 语言局限性第21-22页
     ·HTML 与WEB 网页第21页
     ·HTML 的局限性第21页
     ·格式良好的HTML 文档第21-22页
   ·XML 相关技术第22-26页
     ·XML 的起源和发展第22页
     ·XML 的特点第22-23页
     ·XML 的结构特征和模式第23-25页
     ·XML 技术在本文中的应用第25-26页
第三章 基于XML 网页结构复用系统框架模型第26-40页
   ·系统框架设计目标第26页
   ·系统框架总体结构第26-36页
     ·Enhydra 及其核心技术XMLC第27-31页
     ·文档对象模型(DOM)第31-35页
     ·XMLC 中的DOM第35-36页
     ·XMLC 在网页结构复用中的优势第36页
   ·系统框架组成模块第36-40页
     ·页面预处理模块第36-37页
     ·结构抽取模块第37-38页
     ·XMLC 编译器第38页
     ·组件集成模块第38-39页
     ·系统表现层子框架第39-40页
第四章 网页结构抽取过程设计与实现第40-56页
   ·网页结构抽取过程设计第40-41页
   ·网页获取第41-45页
     ·目标网页的指定方式(POST/GET)第41-44页
     ·网站连接登录问题第44-45页
     ·HTML 源代码获取第45页
   ·抽取规则定义第45-48页
     ·网页模式提取第46页
     ·目标模板模式的建立第46-47页
     ·DOM 节点抽取过程描述文件第47-48页
   ·结构抽取实施第48-55页
     ·获取网页数据第48页
     ·HTML 到XML 的转换第48-50页
     ·DOM 树的建立和打印第50-52页
     ·目标模板的建立第52-53页
     ·映射规则执行第53页
     ·抽取规则执行算法第53-55页
     ·将DOM 文档转换为XML 文件第55页
   ·本章小结第55-56页
结论与展望第56-57页
参考文献第57-60页
致谢第60-61页
附录(攻读学位期间所发表的学术论文)第61-62页
详细摘要第62-66页

论文共66页,点击 下载论文
上一篇:介词结构“在X上/里/中”中“X”的研究
下一篇:一种水稻矮化突变体的生理特性及调控研究