首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

针对模板生成网页的数据自动抽取方法的探讨与应用

摘要第1-9页
Abstract第9-13页
第1章 绪论第13-19页
   ·论文研究背景及意义第13-14页
   ·国内外研究现状第14-16页
   ·论文的研究内容及创新之处第16-17页
   ·论文组织结构第17-19页
第2章 Web信息抽取技术的相关概述第19-28页
   ·Web页面数据的半结构化特征第19-20页
   ·Web信息抽取技术的介绍第20-21页
   ·Web信息抽取技术的发展现状第21-25页
     ·Web信息抽取技术的分类第21-24页
     ·Web信息抽取技术存在的问题和不足第24-25页
   ·Web信息抽取系统的评测指标第25-27页
   ·本章小结第27-28页
第3章 相关理论准备第28-37页
   ·HTML介绍第28-31页
     ·HTML语言的发展历史第28页
     ·HTML语言的基本功能和特点第28-30页
     ·HTML语言的局限性第30-31页
   ·XML介绍第31-32页
   ·XHTML介绍第32-33页
   ·网页预处理第33-35页
     ·HTML向XHTML转换第34-35页
   ·XHTML文档解析成树结构第35-36页
     ·文档对象模型(DOM)第35-36页
   ·本章小结第36-37页
第4章 针对模板生成网页的数据自动抽取方法的设计与实现第37-62页
   ·文中涉及的主要概念第39-45页
     ·Web页面表示第39-41页
     ·模板和模板检测的定义第41-42页
     ·Ctoken的定义第42-45页
   ·针对模板生成网页的数据自动抽取方法的原型系统的设计第45-47页
     ·系统设计的总体框架第45-47页
     ·系统的基本设计思想第47页
   ·针对模板生成网页的数据自动抽取方法的实现第47-60页
     ·HTML页面预处理第47-48页
     ·HTML页面解析第48-50页
     ·标签树匹配算法第50-53页
     ·计算Ctokens第53-58页
     ·网页模板的构造和网页中有效数据的自动抽取第58-60页
   ·本章小结第60-62页
第5章 针对模板生成网页的数据自动抽取方法的实验第62-69页
   ·实验平台第62-63页
   ·针对模板生成网页的数据自动抽取方法的工作流程第63-64页
   ·在某电子商务网站上的应用第64-66页
   ·实验结果分析第66-68页
   ·本章小结第68-69页
第6章 总结与展望第69-71页
   ·论文总结第69-70页
   ·未来工作展望第70-71页
参考文献第71-74页
致谢第74-75页
攻读硕士学位期间发表的学术论文及参与的项目与实践第75页

论文共75页,点击 下载论文
上一篇:基于P2P网络的分离声誉系统模型
下一篇:基于Web Service和XPMS的网络信息平台应用研究