摘要 | 第1-5页 |
Abstract | 第5-10页 |
第1章 绪论 | 第10-19页 |
·研究背景和意义 | 第10-11页 |
·研究背景 | 第10页 |
·研究意义 | 第10-11页 |
·国内外研究现状综述 | 第11-16页 |
·Web 信息抽取的研究现状 | 第11-13页 |
·基于ontology 的信息抽取研究现状 | 第13-16页 |
·研究问题定义 | 第16-17页 |
·研究内容 | 第17页 |
·本文的结构安排 | 第17-19页 |
第2章 Blog 数据的特征表示模型 | 第19-31页 |
·引言 | 第19页 |
·Ajax 异步传输数据原理 | 第19-23页 |
·Ajax 基本介绍 | 第19-20页 |
·异步传输过程分析 | 第20-23页 |
·异步传输数据提取方案 | 第23-26页 |
·在爬虫中执行JavaScript 代码 | 第23页 |
·重新构建DOM 树 | 第23-26页 |
·Blog 数据特征的表示 | 第26-29页 |
·HTML 文档解析 | 第26页 |
·Blog 网页特征选取与特征表示 | 第26-29页 |
·实验设计与结果分析 | 第29-30页 |
·数据源分析 | 第29页 |
·提取效果分析 | 第29-30页 |
·本章小结 | 第30-31页 |
第3章 基于ontology 的Blog 信息抽取模板构建 | 第31-46页 |
·引言 | 第31页 |
·ontology 的基本理论 | 第31-34页 |
·ontology 的应用 | 第31-32页 |
·ontology 的分类 | 第32页 |
·ontology 的构建规则 | 第32-33页 |
·ontology 建模元语 | 第33-34页 |
·构建 Blog 领域 ontology | 第34-44页 |
·本文的ontology 构建方法 | 第35-36页 |
·Blog 页面信息分析 | 第36-37页 |
·构建Blog ontology | 第37-41页 |
·ontology 概念定义 | 第41-44页 |
·ontolgoy 构建结果与分析 | 第44-45页 |
·ontology 构建结果 | 第44-45页 |
·ontology 检测 | 第45页 |
·本章小结 | 第45-46页 |
第4章 基于ontology 的Blog 信息抽取算法 | 第46-53页 |
·引言 | 第46页 |
·抽取规则的构造 | 第46-48页 |
·训练空间生成 | 第46页 |
·规则构造 | 第46-47页 |
·规则生成算法描述 | 第47-48页 |
·Blog 领域 ontology 信息抽取 | 第48-50页 |
·信息抽取算法 | 第48-50页 |
·实验分析 | 第50-52页 |
·信息抽取的评价指标 | 第50页 |
·实验结果 | 第50-52页 |
·本章小结 | 第52-53页 |
第5章 Blog 信息抽取系统的设计与实现 | 第53-62页 |
·系统功能与环境 | 第53-54页 |
·开发目的及功能 | 第53-54页 |
·开发平台及工具 | 第54页 |
·系统总体设计 | 第54-55页 |
·系统模块设计与实现 | 第55-59页 |
·异步网络爬虫模块 | 第55-57页 |
·ontology 解析与生成抽取规则模块 | 第57-58页 |
·ontology 信息抽取模块 | 第58-59页 |
·系统演示 | 第59-61页 |
·本章小结 | 第61-62页 |
结论 | 第62-64页 |
参考文献 | 第64-68页 |
攻读学位期间发表的学术论文 | 第68-70页 |
致谢 | 第70页 |