| 摘要 | 第1-5页 |
| Abstract | 第5-10页 |
| 第1章 绪论 | 第10-19页 |
| ·研究背景和意义 | 第10-11页 |
| ·研究背景 | 第10页 |
| ·研究意义 | 第10-11页 |
| ·国内外研究现状综述 | 第11-16页 |
| ·Web 信息抽取的研究现状 | 第11-13页 |
| ·基于ontology 的信息抽取研究现状 | 第13-16页 |
| ·研究问题定义 | 第16-17页 |
| ·研究内容 | 第17页 |
| ·本文的结构安排 | 第17-19页 |
| 第2章 Blog 数据的特征表示模型 | 第19-31页 |
| ·引言 | 第19页 |
| ·Ajax 异步传输数据原理 | 第19-23页 |
| ·Ajax 基本介绍 | 第19-20页 |
| ·异步传输过程分析 | 第20-23页 |
| ·异步传输数据提取方案 | 第23-26页 |
| ·在爬虫中执行JavaScript 代码 | 第23页 |
| ·重新构建DOM 树 | 第23-26页 |
| ·Blog 数据特征的表示 | 第26-29页 |
| ·HTML 文档解析 | 第26页 |
| ·Blog 网页特征选取与特征表示 | 第26-29页 |
| ·实验设计与结果分析 | 第29-30页 |
| ·数据源分析 | 第29页 |
| ·提取效果分析 | 第29-30页 |
| ·本章小结 | 第30-31页 |
| 第3章 基于ontology 的Blog 信息抽取模板构建 | 第31-46页 |
| ·引言 | 第31页 |
| ·ontology 的基本理论 | 第31-34页 |
| ·ontology 的应用 | 第31-32页 |
| ·ontology 的分类 | 第32页 |
| ·ontology 的构建规则 | 第32-33页 |
| ·ontology 建模元语 | 第33-34页 |
| ·构建 Blog 领域 ontology | 第34-44页 |
| ·本文的ontology 构建方法 | 第35-36页 |
| ·Blog 页面信息分析 | 第36-37页 |
| ·构建Blog ontology | 第37-41页 |
| ·ontology 概念定义 | 第41-44页 |
| ·ontolgoy 构建结果与分析 | 第44-45页 |
| ·ontology 构建结果 | 第44-45页 |
| ·ontology 检测 | 第45页 |
| ·本章小结 | 第45-46页 |
| 第4章 基于ontology 的Blog 信息抽取算法 | 第46-53页 |
| ·引言 | 第46页 |
| ·抽取规则的构造 | 第46-48页 |
| ·训练空间生成 | 第46页 |
| ·规则构造 | 第46-47页 |
| ·规则生成算法描述 | 第47-48页 |
| ·Blog 领域 ontology 信息抽取 | 第48-50页 |
| ·信息抽取算法 | 第48-50页 |
| ·实验分析 | 第50-52页 |
| ·信息抽取的评价指标 | 第50页 |
| ·实验结果 | 第50-52页 |
| ·本章小结 | 第52-53页 |
| 第5章 Blog 信息抽取系统的设计与实现 | 第53-62页 |
| ·系统功能与环境 | 第53-54页 |
| ·开发目的及功能 | 第53-54页 |
| ·开发平台及工具 | 第54页 |
| ·系统总体设计 | 第54-55页 |
| ·系统模块设计与实现 | 第55-59页 |
| ·异步网络爬虫模块 | 第55-57页 |
| ·ontology 解析与生成抽取规则模块 | 第57-58页 |
| ·ontology 信息抽取模块 | 第58-59页 |
| ·系统演示 | 第59-61页 |
| ·本章小结 | 第61-62页 |
| 结论 | 第62-64页 |
| 参考文献 | 第64-68页 |
| 攻读学位期间发表的学术论文 | 第68-70页 |
| 致谢 | 第70页 |