首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

特定领域的Deep Web数据抽取与语义标注研究

中文摘要第1-5页
Abstract第5-10页
第1章 引言第10-16页
   ·研究背景第10-12页
   ·国内外的研究动态第12-13页
   ·研究难点第13页
   ·论文主要研究内容第13-14页
   ·论文的结构安排第14-16页
第2章 Web 信息抽取第16-31页
   ·Web 信息抽取的发展历史第16-18页
   ·Web 信息抽取方法的分类第18-23页
   ·Web 信息抽取相关技术介绍第23-29页
     ·HTML、XML、XHTML 介绍第23-25页
     ·DOM 模型第25-27页
     ·字符串匹配技术第27页
     ·树匹配技术第27-29页
   ·Web 信息抽取评价标准第29-30页
     ·Web 信息抽取结果的评价第29-30页
     ·Web 信息抽取性能的评价第30页
   ·本章小结第30-31页
第3章 Deep Web 结果页面数据记录抽取第31-48页
   ·相关概念定义第31-32页
   ·Deep Web 结果页面净化第32-38页
     ·研究意义第33-34页
     ·相关研究第34-35页
     ·网页净化算法第35-38页
   ·针对数据记录的自动抽取方法第38-44页
     ·基本思路第38-39页
     ·相关研究第39页
     ·抽取方法描述第39-44页
   ·实验第44-47页
     ·实验数据第44页
     ·页面净化算法实验结果及分析第44-46页
     ·数据记录抽取算法实验结果及分析第46-47页
   ·本章小结第47-48页
第4章 基于领域本体的数据项抽取及语义标注第48-68页
   ·问题描述第48-51页
     ·数据项抽取与语义标注的关系第48-49页
     ·常见的语义标注方法与缺陷第49-51页
   ·本体知识概述第51-54页
     ·本体的定义第51-52页
     ·本体的作用第52-53页
     ·本体的描述语言第53-54页
   ·研究思路第54-55页
   ·领域本体的构建第55-57页
   ·本体与接口/结果模式的映射第57-63页
     ·接口模式与结果模式特征分析第57-58页
     ·基于多相似度的映射模型第58-63页
   ·语义标注算法实现第63-64页
   ·实验结果及分析第64-67页
   ·本章小结第67-68页
第5章 原型系统设计第68-78页
   ·系统背景第68-69页
   ·系统架构及流程第69-71页
   ·核心模块设计第71-77页
     ·Deep Web 聚焦爬虫第71-73页
     ·数据记录抽取子系统第73-74页
     ·数据标注子系统第74-75页
     ·基于Lucene 的全文检索子系统第75-77页
   ·本章小结第77-78页
第6章 总结与展望第78-81页
   ·工作总结第78页
   ·特色与创新第78-79页
   ·工作展望第79-81页
参考文献第81-87页
攻读学位期间公开发表的论文与参与的科研项目第87-88页
致谢第88-89页

论文共89页,点击 下载论文
上一篇:遮挡情况下的车辆检测与跟踪
下一篇:领域间适应性情感分类方法研究