首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于ontology的Blog信息抽取技术研究

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-19页
   ·研究背景和意义第10-11页
     ·研究背景第10页
     ·研究意义第10-11页
   ·国内外研究现状综述第11-16页
     ·Web 信息抽取的研究现状第11-13页
     ·基于ontology 的信息抽取研究现状第13-16页
   ·研究问题定义第16-17页
   ·研究内容第17页
   ·本文的结构安排第17-19页
第2章 Blog 数据的特征表示模型第19-31页
   ·引言第19页
   ·Ajax 异步传输数据原理第19-23页
     ·Ajax 基本介绍第19-20页
     ·异步传输过程分析第20-23页
   ·异步传输数据提取方案第23-26页
     ·在爬虫中执行JavaScript 代码第23页
     ·重新构建DOM 树第23-26页
   ·Blog 数据特征的表示第26-29页
     ·HTML 文档解析第26页
     ·Blog 网页特征选取与特征表示第26-29页
   ·实验设计与结果分析第29-30页
     ·数据源分析第29页
     ·提取效果分析第29-30页
   ·本章小结第30-31页
第3章 基于ontology 的Blog 信息抽取模板构建第31-46页
   ·引言第31页
   ·ontology 的基本理论第31-34页
     ·ontology 的应用第31-32页
     ·ontology 的分类第32页
     ·ontology 的构建规则第32-33页
     ·ontology 建模元语第33-34页
   ·构建 Blog 领域 ontology第34-44页
     ·本文的ontology 构建方法第35-36页
     ·Blog 页面信息分析第36-37页
     ·构建Blog ontology第37-41页
     ·ontology 概念定义第41-44页
   ·ontolgoy 构建结果与分析第44-45页
     ·ontology 构建结果第44-45页
     ·ontology 检测第45页
   ·本章小结第45-46页
第4章 基于ontology 的Blog 信息抽取算法第46-53页
   ·引言第46页
   ·抽取规则的构造第46-48页
     ·训练空间生成第46页
     ·规则构造第46-47页
     ·规则生成算法描述第47-48页
   ·Blog 领域 ontology 信息抽取第48-50页
     ·信息抽取算法第48-50页
   ·实验分析第50-52页
     ·信息抽取的评价指标第50页
     ·实验结果第50-52页
   ·本章小结第52-53页
第5章 Blog 信息抽取系统的设计与实现第53-62页
   ·系统功能与环境第53-54页
     ·开发目的及功能第53-54页
     ·开发平台及工具第54页
   ·系统总体设计第54-55页
   ·系统模块设计与实现第55-59页
     ·异步网络爬虫模块第55-57页
     ·ontology 解析与生成抽取规则模块第57-58页
     ·ontology 信息抽取模块第58-59页
   ·系统演示第59-61页
   ·本章小结第61-62页
结论第62-64页
参考文献第64-68页
攻读学位期间发表的学术论文第68-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:面向金融信息的主题爬虫研究与应用
下一篇:基于半监督聚类的爬虫在线样本生成算法