首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Deep Web的网络信息抽取技术研究

摘要第1-6页
Abstract第6-9页
第一章 绪论第9-14页
   ·研究背景第9-10页
   ·国内外研究现状第10-12页
   ·论文的主要研究工作第12页
   ·论文的组织结构第12-14页
第二章 Web 信息抽取概述第14-20页
   ·Web 信息抽取的概念第14页
   ·Web 信息抽取技术的分类第14-18页
     ·人为手工编写抽取规则的Web 信息抽取方法第14-15页
     ·半自动的Web 信息抽取方法第15-17页
     ·全自动的Web 信息抽取方法第17-18页
   ·各种信息抽取技术的比较第18-19页
   ·本章小结第19-20页
第三章 相关技术第20-29页
   ·HTML 技术第20-21页
   ·XML 技术第21-24页
   ·XHTML 技术第24页
   ·XPath 技术第24-25页
   ·XSLT 技术第25-26页
   ·正则表达式第26-27页
   ·DOM 技术第27-28页
   ·本章小结第28-29页
第四章 基于Deep Web 的半结构化信息抽取方法第29-50页
   ·Deep Web 数据特点分析第29-30页
   ·HTML 页面预处理第30-35页
     ·HTML 网页信息清洗第31-33页
     ·HTML 的DOM 树生成第33-35页
   ·数据区域识别第35-43页
     ·相关概念第35-37页
     ·叶子节点相似度第37-39页
     ·基于相似度的层次划分算法第39-43页
   ·数据块提取第43-45页
   ·数据项抽取第45-48页
     ·基于树匹配的编辑算法第46-47页
     ·基于树匹配的数据项发现算法第47-48页
   ·本章小结第48-50页
第五章 Deep Web Extractor 系统的设计与实现第50-55页
   ·系统的设计目标第50页
   ·系统的架构第50-51页
   ·系统的实现第51-53页
   ·实验结果分析第53-54页
   ·本章小结第54-55页
结束语第55-56页
参考文献第56-58页
攻读硕士学位期间取得的研究成果第58-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:新会双水发电厂2×660MW机组热电联产工程的电气方案设计
下一篇:基于PCIE总线的CCSDS标准卫星数据采集软件开发