摘要 | 第5-7页 |
Abstract | 第7-8页 |
第1章 引言 | 第14-29页 |
1.1 研究背景 | 第14-16页 |
1.2 研究现状和存在的问题 | 第16-24页 |
1.2.1 本体构建 | 第16-21页 |
1.2.2 现有本体构建方法的不足 | 第21-22页 |
1.2.3 知识图谱构建 | 第22-23页 |
1.2.4 知识图谱相关研究存在的问题 | 第23-24页 |
1.2.5 中文知识图谱构建的特殊性 | 第24页 |
1.3 研究内容及意义 | 第24-26页 |
1.3.1 研究内容 | 第24-25页 |
1.3.2 主要研究贡献 | 第25-26页 |
1.4 本文的组织 | 第26-29页 |
第2章 知识图谱构建过程 | 第29-35页 |
2.1 知识图谱的本体学习 | 第29-32页 |
2.1.1 术语抽取 | 第29-30页 |
2.1.2 同义关系抽取 | 第30页 |
2.1.3 概念抽取 | 第30-31页 |
2.1.4 分类学关系抽取 | 第31页 |
2.1.5 非分类关系学习 | 第31-32页 |
2.1.6 公理和规则学习 | 第32页 |
2.2 实体层的学习 | 第32-33页 |
2.2.1 实体学习 | 第32页 |
2.2.2 实体数据填充 | 第32-33页 |
2.2.3 实体对齐 | 第33页 |
2.3 知识图谱的数据更新 | 第33-34页 |
2.3.1 数据模式层的更新 | 第33-34页 |
2.3.2 数据层的更新 | 第34页 |
2.4 通用知识图谱和行业知识图谱构建的区别 | 第34页 |
2.5 本章小结 | 第34-35页 |
第3章 知识图谱构建的可用数据源分析 | 第35-54页 |
3.1 数据源分析 | 第35-40页 |
3.1.1 结构化数据 | 第35页 |
3.1.2 机器可读的开放本体或辞典 | 第35-36页 |
3.1.3 开放链接数据与开放知识库 | 第36-38页 |
3.1.4 行业知识库和行业垂直网站 | 第38页 |
3.1.5 在线百科 | 第38-40页 |
3.1.6 文本 | 第40页 |
3.2 数据源采集 | 第40-44页 |
3.2.1 开放链接数据采集 | 第41页 |
3.2.2 百科采集 | 第41-42页 |
3.2.3 文本信息采集 | 第42-44页 |
3.3 数据清洗 | 第44-53页 |
3.3.1 常用的网页内容抽取方法 | 第44-45页 |
3.3.2 基于启发式规则的网页正文内容抽取方法 | 第45-50页 |
3.3.3 网页正文内容抽取方法评估 | 第50-51页 |
3.3.4 论坛内容的抽取 | 第51-53页 |
3.3.5 其它类型网页中内容的抽取 | 第53页 |
3.4 本章小结 | 第53-54页 |
第4章 基于多数据源的通用知识图谱构建 | 第54-92页 |
4.1 概念和实体学习 | 第54-55页 |
4.1.1 从开放链接数据集中抽取概念和实体 | 第54页 |
4.1.2 从百科中抽取概念和实体 | 第54页 |
4.1.3 同名多义概念或实体 | 第54-55页 |
4.1.4 概念或实体的摘要信息 | 第55页 |
4.2 实体对齐(同义关系学习) | 第55-72页 |
4.2.1 从开放链接数据集中抽取同义关系 | 第55页 |
4.2.2 基于百科结构化数据的百科实体对齐 | 第55-56页 |
4.2.3 基于SVM的自监督百科实体对齐方法 | 第56-61页 |
4.2.4 开放链接数据集与百科间的实体对齐 | 第61页 |
4.2.5 基于语言学模式的方法 | 第61页 |
4.2.6 基于CRF的开放同义关系学习 | 第61-72页 |
4.3 上下位关系学习 | 第72-76页 |
4.3.1 从开放链接数据集中抽取上下位关系 | 第72-73页 |
4.3.2 从百科中抽取上下位关系 | 第73-74页 |
4.3.3 基于语言学模式的上下位关系抽取方法 | 第74页 |
4.3.4 基于CRF的开放上下位关系学习方法 | 第74-75页 |
4.3.5 分类树整合 | 第75-76页 |
4.4 属性学习 | 第76-79页 |
4.4.1 概念的属性学习(数据模式的学习) | 第76页 |
4.4.2 从开放链接数据集中抽取概念属性 | 第76页 |
4.4.3 从百科中抽取实体属性 | 第76-77页 |
4.4.4 实体属性升级成为概念属性 | 第77-78页 |
4.4.5 概念属性的人工校验 | 第78页 |
4.4.6 实体属性值的学习 | 第78-79页 |
4.5 规则和公理学习 | 第79页 |
4.6 学习过程中的冲突解决 | 第79-81页 |
4.6.1 冲突发生点分析 | 第79-80页 |
4.6.2 冲突检测 | 第80页 |
4.6.3 冲突解决方法 | 第80-81页 |
4.7 知识图谱的更新 | 第81-82页 |
4.7.1 数据模式层的更新 | 第81页 |
4.7.2 数据层的更新 | 第81-82页 |
4.8 实验与结果分析 | 第82-90页 |
4.8.1 学习语料 | 第82页 |
4.8.2 知识图谱评估方法 | 第82页 |
4.8.3 知识图谱结果概览 | 第82-83页 |
4.8.4 概念评估 | 第83-84页 |
4.8.5 实体评估 | 第84页 |
4.8.6 实体对齐与同义关系评估 | 第84-85页 |
4.8.7 基于SVM的自监督百科实体对齐方法评估 | 第85页 |
4.8.8 基于语言学模式的同义学习方法评估 | 第85-86页 |
4.8.9 基于CRF的开放同义关系学习方法评估 | 第86-88页 |
4.8.10 上下位关系学习结果评估 | 第88-89页 |
4.8.11 属性学习结果评估 | 第89页 |
4.8.12 对比分析 | 第89-90页 |
4.9 小结与讨论 | 第90-92页 |
4.9.1 本章小结 | 第90页 |
4.9.2 知识图谱构建讨论 | 第90-92页 |
第5章 基于多数据源的行业知识图谱构建 | 第92-102页 |
5.1 行业知识图谱构建 | 第92-93页 |
5.2 从结构化数据中学习知识 | 第93-94页 |
5.2.1 D2R | 第93页 |
5.2.2 结构化数据映射工具 | 第93-94页 |
5.2.3 结构化数据知识映射 | 第94页 |
5.3 行业知识库与行业网站的自动发现与抽取 | 第94-96页 |
5.4 行业数据源解析 | 第96-98页 |
5.5 从开放链接数据和在线百科中学习知识 | 第98页 |
5.5.1 实体对齐 | 第98页 |
5.5.2 实体的添加 | 第98页 |
5.5.3 属性知识的学习 | 第98页 |
5.6 从文本中学习知识 | 第98-99页 |
5.7 实验与结果分析 | 第99-100页 |
5.7.1 D2R分析 | 第99页 |
5.7.2 行业知识库和行业专业网站的自动发现 | 第99页 |
5.7.3 行业数据源解析与抽取 | 第99-100页 |
5.7.4 从百科中学习鱼类知识图谱 | 第100页 |
5.7.5 从文本中学习鱼类知识图谱 | 第100页 |
5.8 本章小结 | 第100-102页 |
第6章 知识图谱编辑与学习平台 | 第102-116页 |
6.1 现有的知识编辑工具 | 第102-104页 |
6.2 知识图谱协作编辑与学习平台设计 | 第104-105页 |
6.3 功能详述 | 第105-109页 |
6.3.1 知识学习配置 | 第106页 |
6.3.2 数据模式定义 | 第106页 |
6.3.3 基础知识编辑 | 第106页 |
6.3.4 知识图谱的完整性和一致性 | 第106-107页 |
6.3.5 并发协作编辑 | 第107页 |
6.3.6 版本管理 | 第107页 |
6.3.7 知识存储 | 第107-108页 |
6.3.8 数据备份 | 第108页 |
6.3.9 用户与权限管理 | 第108-109页 |
6.4 编辑平台与学习算法的衔接 | 第109页 |
6.5 知识图谱的应用 | 第109-115页 |
6.5.1 语义检索 | 第109-112页 |
6.5.2 知识导航 | 第112页 |
6.5.3 决策支持 | 第112-114页 |
6.5.4 知识图谱在行业中的应用 | 第114-115页 |
6.6 本章小结 | 第115-116页 |
第7章 总结和展望 | 第116-118页 |
7.1 全文总结 | 第116页 |
7.2 展望 | 第116-118页 |
参考文献 | 第118-128页 |
致谢 | 第128-129页 |
附录1 攻读学位期间发表的学术论文 | 第129-130页 |
附录2 攻读学位期间参加的科研项目 | 第130页 |