特定领域的Deep Web数据抽取与语义标注研究

中文摘要	第1-5页
Abstract	第5-10页
第1章引言	第10-16页
·研究背景	第10-12页
·国内外的研究动态	第12-13页
·研究难点	第13页
·论文主要研究内容	第13-14页
·论文的结构安排	第14-16页
第2章 Web 信息抽取	第16-31页
·Web 信息抽取的发展历史	第16-18页
·Web 信息抽取方法的分类	第18-23页
·Web 信息抽取相关技术介绍	第23-29页
·HTML、XML、XHTML 介绍	第23-25页
·DOM 模型	第25-27页
·字符串匹配技术	第27页
·树匹配技术	第27-29页
·Web 信息抽取评价标准	第29-30页
·Web 信息抽取结果的评价	第29-30页
·Web 信息抽取性能的评价	第30页
·本章小结	第30-31页
第3章 Deep Web 结果页面数据记录抽取	第31-48页
·相关概念定义	第31-32页
·Deep Web 结果页面净化	第32-38页
·研究意义	第33-34页
·相关研究	第34-35页
·网页净化算法	第35-38页
·针对数据记录的自动抽取方法	第38-44页
·基本思路	第38-39页
·相关研究	第39页
·抽取方法描述	第39-44页
·实验	第44-47页
·实验数据	第44页
·页面净化算法实验结果及分析	第44-46页
·数据记录抽取算法实验结果及分析	第46-47页
·本章小结	第47-48页
第4章基于领域本体的数据项抽取及语义标注	第48-68页
·问题描述	第48-51页
·数据项抽取与语义标注的关系	第48-49页
·常见的语义标注方法与缺陷	第49-51页
·本体知识概述	第51-54页
·本体的定义	第51-52页
·本体的作用	第52-53页
·本体的描述语言	第53-54页
·研究思路	第54-55页
·领域本体的构建	第55-57页
·本体与接口/结果模式的映射	第57-63页
·接口模式与结果模式特征分析	第57-58页
·基于多相似度的映射模型	第58-63页
·语义标注算法实现	第63-64页
·实验结果及分析	第64-67页
·本章小结	第67-68页
第5章原型系统设计	第68-78页
·系统背景	第68-69页
·系统架构及流程	第69-71页
·核心模块设计	第71-77页
·Deep Web 聚焦爬虫	第71-73页
·数据记录抽取子系统	第73-74页
·数据标注子系统	第74-75页
·基于Lucene 的全文检索子系统	第75-77页
·本章小结	第77-78页
第6章总结与展望	第78-81页
·工作总结	第78页
·特色与创新	第78-79页
·工作展望	第79-81页
参考文献	第81-87页
攻读学位期间公开发表的论文与参与的科研项目	第87-88页
致谢	第88-89页