摘要 | 第4-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第11-28页 |
1.1 语料库 | 第11-14页 |
1.1.1 语料库的概念 | 第11-12页 |
1.1.2 语料库实例 | 第12-13页 |
1.1.3 语料库的特点 | 第13-14页 |
1.2 研究背景与意义 | 第14-16页 |
1.2.1 语料库的发展背景 | 第14页 |
1.2.2 语料库中信息抽取的技术与应用背景 | 第14-16页 |
1.2.3 语料库查询处理问题研究的意义 | 第16页 |
1.3 语料库上信息抽取相关技术的研究现状 | 第16-25页 |
1.3.1 面向无结构语料库信息抽取的技术及其应用 | 第16-18页 |
1.3.2 面向半结构语料库的信息抽取技术及其应用 | 第18-21页 |
1.3.3 面向结构化语料库的信息抽取技术及其应用 | 第21-23页 |
1.3.4 现有语料库查询系统的对比及研究中存在的问题 | 第23-25页 |
1.4 课题研究的主要内容 | 第25-26页 |
1.5 论文结构 | 第26-28页 |
第2章 描述语料库的数据模型 | 第28-37页 |
2.1 引言 | 第28页 |
2.2 语料库的概念及XML表示 | 第28-31页 |
2.3 语料库的形式化定义 | 第31-32页 |
2.3.1 语料库基本元素的形式化定义 | 第31页 |
2.3.2 语料库的形式化定义 | 第31-32页 |
2.4 语料库的逻辑模型及其完备性 | 第32-36页 |
2.4.1 关系模型的定义 | 第32-33页 |
2.4.2 语料库的数据模型 | 第33-35页 |
2.4.3 模型的完备性 | 第35-36页 |
2.5 本章小结 | 第36-37页 |
第3章 语料库基本查询问题及其查询处理 | 第37-63页 |
3.1 引言 | 第37页 |
3.2 语料库的查询问题描述 | 第37-42页 |
3.2.1 基本定义 | 第37-39页 |
3.2.2 问题描述 | 第39-42页 |
3.3 语料库查询问题的复杂度 | 第42-49页 |
3.3.1 基础知识 | 第42-44页 |
3.3.2 复杂度分析 | 第44-49页 |
3.4 语料库的查询处理方法 | 第49-57页 |
3.4.1 面向语料库的关系代数操作 | 第49-50页 |
3.4.2 语料库查询的重写算法及分析 | 第50-52页 |
3.4.3 语料库的查询处理方法及分析 | 第52-55页 |
3.4.4 语料库的查询优化策略 | 第55-57页 |
3.5 实验分析 | 第57-61页 |
3.5.1 实验环境与数据集 | 第57页 |
3.5.2 实验结果与分析 | 第57-61页 |
3.6 本章小结 | 第61-63页 |
第4章 语料库关键字查询问题及其查询处理 | 第63-86页 |
4.1 引言 | 第63-64页 |
4.2 问题描述 | 第64-69页 |
4.2.1 研究动机 | 第64-67页 |
4.2.2 数据模型 | 第67-69页 |
4.2.3 问题描述 | 第69页 |
4.3 评分策略 | 第69-73页 |
4.3.1 顶点评分方法 | 第70-71页 |
4.3.2 边评分方法 | 第71-72页 |
4.3.3 元组连接树相关度评分方法 | 第72-73页 |
4.4 数据图的创建 | 第73-74页 |
4.4.1 算法描述 | 第73-74页 |
4.4.2 算法分析 | 第74页 |
4.5 关键字索引 | 第74-76页 |
4.5.1 语料库关键字倒排索引的组织 | 第74-75页 |
4.5.2 关键字倒排索引的创建算法 | 第75页 |
4.5.3 算法分析 | 第75-76页 |
4.6 结果树枚举 | 第76-81页 |
4.6.1 元组连接树扩展操作 | 第76-77页 |
4.6.2 结果树近似枚举算法 | 第77-78页 |
4.6.3 实例分析 | 第78-79页 |
4.6.4 算法正确性分析 | 第79-80页 |
4.6.5 算法复杂度分析 | 第80页 |
4.6.6 算法优化策略 | 第80-81页 |
4.7 语料库关键字查询处理算法 | 第81页 |
4.8 实验分析 | 第81-85页 |
4.8.1 实验环境与数据集 | 第81-82页 |
4.8.2 实验结果与分析 | 第82-85页 |
4.9 本章小结 | 第85-86页 |
第5章 语料库上基于语句的语义查询问题及其查询处理 | 第86-106页 |
5.1 引言 | 第86-87页 |
5.2 基础知识 | 第87-92页 |
5.2.1 依存语法 | 第87-89页 |
5.2.2 向量空间模型 | 第89-91页 |
5.2.3 基于WordNet的词汇相似度 | 第91-92页 |
5.3 问题描述 | 第92页 |
5.4 语义相似度的度量 | 第92-97页 |
5.4.1 文本正态化 | 第93-94页 |
5.4.2 单词节点依存关系集 | 第94-97页 |
5.4.3 语句的语义相似度 | 第97页 |
5.5 句法相似度的度量 | 第97-99页 |
5.5.1 语句的有效依存结构集 | 第98-99页 |
5.5.2 语句的句法相似度 | 第99页 |
5.6 语句相似度的度量 | 第99-100页 |
5.7 基于语句相似度的语义查询处理算法 | 第100-101页 |
5.7.1 算法思想 | 第100页 |
5.7.2 算法描述 | 第100-101页 |
5.8 实验分析 | 第101-105页 |
5.8.1 语句相似度算法的有效性分析 | 第101-104页 |
5.8.2 基于语句相似度的语义查询处理算法有效性分析 | 第104-105页 |
5.9 本章小结 | 第105-106页 |
第6章 语料库查询系统的设计与实现 | 第106-117页 |
6.1 语料库查询系统概述 | 第106-108页 |
6.1.1 语料库查询系统的基本概念 | 第107页 |
6.1.2 语料库查询系统的逻辑功能 | 第107-108页 |
6.2 语料库查询系统体系结构 | 第108-109页 |
6.3 语料库查询原型系统R-CQS的实现 | 第109-116页 |
6.3.1 开发环境 | 第109-110页 |
6.3.2 数据管理模块 | 第110-111页 |
6.3.3 索引模块测试 | 第111页 |
6.3.4 面向语料库的查询处理模块测试 | 第111-116页 |
6.4 本章小结 | 第116-117页 |
结论 | 第117-119页 |
参考文献 | 第119-128页 |
攻读博士学位期间承担的科研任务与主要成果 | 第128-130页 |
致谢 | 第130页 |