摘要 | 第6-8页 |
ABSTRACT | 第8-10页 |
第一章 绪论 | 第15-25页 |
1.1 课题来源 | 第15页 |
1.2 课题研究背景 | 第15-17页 |
1.3 国内外相关研究 | 第17-21页 |
1.3.1 概念 | 第17-18页 |
1.3.2 本体的定义及其构造 | 第18-19页 |
1.3.3 语义链网络 | 第19-20页 |
1.3.4 概念空间 | 第20-21页 |
1.3.5 热力学理论在文本信息处理中的应用 | 第21页 |
1.4 主要研究内容 | 第21-23页 |
1.5 创新点和意义 | 第23-25页 |
第二章 文本概念语义空间(TCSS)模型 | 第25-42页 |
摘要 | 第25页 |
本章内容组织 | 第25页 |
2.1 引言 | 第25-27页 |
2.2 TCSS 的热力学理论基础 | 第27-31页 |
2.3 TCSS 的定义 | 第31-35页 |
2.4 TCSS 的特征分析 | 第35-36页 |
2.5 TCSS 与热力学系统的类比分析 | 第36-41页 |
2.5.1 TCSS 的信息交换 | 第37-38页 |
2.5.2 TCSS 的状态与度量 | 第38-40页 |
2.5.3 TCSS 的耗散结构 | 第40-41页 |
2.6 小结 | 第41-42页 |
第三章 文本概念语义空间的性质与构建方法 | 第42-74页 |
摘要 | 第42页 |
本章的内容组织 | 第42页 |
3.1 引言 | 第42-43页 |
3.2 TCSS 信息熵及信息熵收敛定理 | 第43-46页 |
3.2.1 TCSS 信息熵表示 | 第43-45页 |
3.2.2 TCSS 信息熵收敛定理 | 第45-46页 |
3.3 文本概念语义空间的信息熵度量 | 第46-55页 |
3.3.1 基于关键词序列的 TCSS 信息熵度量方法 | 第46-51页 |
3.3.2 基于关键词及其语义关系的 TCSS 信息熵度量方法 | 第51-55页 |
3.4 文本概念语义空间的性质 | 第55-59页 |
3.4.1 关键词语义关系对 TCSS 信息熵的影响 | 第55-56页 |
3.4.2 TCSS 信息熵计算方法 | 第56页 |
3.4.3 TCSS 信息熵收敛定理的证明 | 第56-58页 |
3.4.4 TCSS 信息交换的信息熵计算方法 | 第58-59页 |
3.5 文本概念语义空间的构建方法 | 第59-73页 |
3.5.1 文本集语义信息的预处理 | 第60-61页 |
3.5.2 关键词层语义链网络的构建 | 第61-65页 |
3.5.3 基于关键词层语义链网络的概念提取 | 第65-69页 |
3.5.4 TCSS 概念子系统的生成 | 第69-73页 |
3.6 小结 | 第73-74页 |
第四章 基于先验知识的 TCSS 模型优化研究 | 第74-100页 |
摘要 | 第74页 |
本章的组织结构 | 第74页 |
4.1 引言 | 第74-75页 |
4.2 基于先验知识指导的算法优化模型 | 第75-77页 |
4.3 TCSS 关键词提取算法优化 | 第77-82页 |
4.4 TCSS 关联规则挖掘方法优化 | 第82-89页 |
4.5 TCSS 关键词层关联语义链网络构建方法优化 | 第89-96页 |
4.6 TCSS 概念层次树生成算法优化 | 第96-98页 |
4.7 小结 | 第98-100页 |
第五章 基于耗散结构的 TCSS 模型演化研究 | 第100-124页 |
摘要 | 第100页 |
本章的组织结构 | 第100页 |
5.1 引言 | 第100-101页 |
5.2 TCSS 的耗散结构性质 | 第101-104页 |
5.2.1 耗散结构形成的条件 | 第101-102页 |
5.2.2 TCSS 的耗散结构 | 第102-104页 |
5.3 TCSS 耗散结构的判断方法 | 第104-110页 |
5.3.1 基于 TCSS 信息熵度量的耗散结构判别方法 | 第105-106页 |
5.3.2 基于复杂网络特征分析的耗散结构判别方法 | 第106-108页 |
5.3.3 TCSS 耗散结构判别实验 | 第108-110页 |
5.4 TCSS 演化动力分析 | 第110-114页 |
5.4.1 TCSS 状态的稳定性分析 | 第110-112页 |
5.4.2 TCSS 耗散结构的维持力分析 | 第112页 |
5.4.3 TCSS 演化的动力分析 | 第112-114页 |
5.5 TCSS 的演化过程分析 | 第114-119页 |
5.5.1 TCSS 宏观演化 | 第115页 |
5.5.2 TCSS 微观演化 | 第115-119页 |
5.6 TCSS 耗散结构在非常规突发事件检测中的应用 | 第119-122页 |
5.6.1 应用背景 | 第119-120页 |
5.6.2 基于 TCSS 耗散结构的 Web 事件早期检测方法 | 第120-121页 |
5.6.3 Web 事件检测实验 | 第121-122页 |
5.7 小结 | 第122-124页 |
第六章 TCSS 在概念语义标注数据集构造中的应用 | 第124-138页 |
摘要 | 第124页 |
本章的内容组织结构 | 第124页 |
6.1 引言 | 第124-126页 |
6.2 测试集基础数据的选择 | 第126-128页 |
6.2.1 基础数据的选择 | 第126-127页 |
6.2.2 基础数据存在的问题 | 第127-128页 |
6.3 测试集领域本体的构造及评价指标 | 第128-130页 |
6.3.1 基于先验知识指导的本体自动构造方法 | 第128-129页 |
6.3.2 本体构造算法的评价指标 | 第129-130页 |
6.4 测试集文本语义标注及评价指标 | 第130-135页 |
6.4.1 基于先验知识指导的语义标注方法 | 第131-133页 |
6.4.2 基于本体的语义标注算法评价指标 | 第133-135页 |
6.5 测试数据集的生成 | 第135-137页 |
6.5.1 测试数据集的生成步骤 | 第135-136页 |
6.5.2 测试集基准参考指标 | 第136-137页 |
6.5.3 大规模测试集下载 | 第137页 |
6.6 小结 | 第137-138页 |
第七章 TCSS 在网页集分面自动提取中的应用 | 第138-161页 |
摘要 | 第138页 |
本章的组织结构如 | 第138页 |
7.1 引言 | 第138-139页 |
7.2 相关工作 | 第139-141页 |
7.2.1 分面搜索 | 第139-140页 |
7.2.2 分面提取 | 第140页 |
7.2.3 语义链网络 | 第140页 |
7.2.4 语义挖掘和语义标注 | 第140-141页 |
7.3 分面 | 第141-143页 |
7.3.1 分面定义 | 第141-142页 |
7.3.2 分面提取过程 | 第142-143页 |
7.4 多维度语义索引 | 第143-149页 |
7.4.1 语义索引 | 第144页 |
7.4.2 选择候选索引词 | 第144-146页 |
7.4.3 关联语义索引 (ASI) | 第146-147页 |
7.4.4 相似语义索引 (SSI) | 第147-148页 |
7.4.5 不同维度语义索引的映射 | 第148-149页 |
7.5 基于多维度语义索引的分面提取方法 | 第149-155页 |
7.5.1 MDSI 中关系的分类 | 第151页 |
7.5.2 提取分面 | 第151-153页 |
7.5.3 命名分面 | 第153-154页 |
7.5.4 确定分面值 | 第154-155页 |
7.6 实验 | 第155-160页 |
7.6.1 数据集 | 第155-156页 |
7.6.2 分面提取实验 | 第156-158页 |
7.6.3 分面取值实验 | 第158-159页 |
7.6.4 分面命名实验 | 第159-160页 |
7.7 小结 | 第160-161页 |
第八章 总结与展望 | 第161-165页 |
8.1 本文总结 | 第161-163页 |
8.2 研究展望 | 第163-165页 |
参考文献 | 第165-176页 |
附录 | 第176-179页 |
数据集 1:英文新闻数据集 | 第176页 |
数据集 2:中文新闻数据集 | 第176页 |
数据集 3:PubMed 医学论文摘要数据集 | 第176-177页 |
数据集 4:文本分类数据集 | 第177页 |
数据集 5:关联规则的分类数据集 | 第177页 |
数据集 6:电子商务商品分面数据集 | 第177-178页 |
数据集 7:新闻分面数据集 | 第178-179页 |
作者在攻读博士学位期间公开发表的论文 | 第179-181页 |
作者在攻读博士学位期间申请的专利 | 第181-182页 |
作者在攻读博士学位期间所作的项目 | 第182-183页 |
致谢 | 第183-184页 |