首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向领域的Deep Web信息抽取研究

摘要第1-7页
Abstract第7-9页
第一章 绪论第9-17页
   ·研究背景和意义第9-10页
   ·研究现状第10-15页
     ·Deep Web数据集成第10-11页
     ·信息抽取第11-15页
   ·研究内容第15-16页
   ·论文结构第16-17页
第二章 Deep Web信息抽取框架概述第17-25页
   ·Deep Web第17-18页
     ·Deep Web的类型第17-18页
     ·Deep Web的领域特征第18页
   ·领域本体第18-20页
     ·本体的基本理论第18-20页
     ·引入领域本体的目的第20页
   ·模板第20-23页
     ·模板的概念第20页
     ·现有Web信息抽取模板的分析第20-23页
     ·引入双重模板第23页
   ·模板匹配第23-24页
     ·现有模板匹配方法的分析第23-24页
     ·引入网页相似度计算第24页
   ·Deep Web信息抽取的总体框架第24页
   ·本章小结第24-25页
第三章 网页预处理第25-30页
   ·网页预处理的流程第25-26页
   ·HTML解析第26页
   ·抽取文本第26-27页
   ·中文分词第27-28页
   ·统计词频第28-29页
   ·本章小结第29-30页
第四章 基于领域本体指导的模板构建第30-48页
   ·基本思路第30-31页
   ·领域本体的构建第31-34页
     ·领域本体的构建方法第31-32页
     ·天气和图书领域本体的构建第32-34页
   ·基于DIV块的模板构建第34-41页
     ·模板定义第34-35页
     ·模板生成第35-36页
     ·基于决策树的DIV块分类方法第36-41页
   ·基于表格的模板构建第41-47页
     ·模板定义第41-43页
     ·模板生成第43-47页
   ·本章小结第47-48页
第五章 基于URL和网页相似度的模板匹配第48-58页
   ·模板匹配问题的详细分析第48-50页
     ·基于URL的粗略匹配第48-49页
     ·基于网页相似度的精确匹配第49-50页
   ·网页相似度的度量方法总结与分析第50-53页
     ·文本相似度研究第51页
     ·结构相似度研究第51-53页
   ·基于结构和内容结合的网页相似度计算第53-57页
     ·基本思路第53页
     ·网页相似度的计算方法第53-55页
     ·阈值的确定第55-57页
   ·模板匹配正确率的对比与分析第57页
   ·本章小结第57-58页
第六章 Deep Web信息抽取系统的设计与实现第58-64页
   ·Deep Web信息抽取系统第58-61页
     ·系统的开发环境第58-59页
     ·系统的设计框架第59-60页
     ·系统的实现第60-61页
   ·Deep Web信息抽取的结果与分析第61-63页
     ·实验结果的评价标准第61页
     ·实验结果的统计第61-62页
     ·实验结果的比对与分析第62-63页
   ·本章小结第63-64页
第七章 总结与展望第64-65页
   ·总结第64页
   ·展望第64-65页
参考文献第65-69页
致谢第69-70页
作者简介第70页

论文共70页,点击 下载论文
上一篇:基于视觉的AGV自主导航系统的研制
下一篇:云计算下的关联分析和模糊聚类研究