摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
第1章 绪论 | 第16-33页 |
1.1 课题的意义和背景 | 第16-20页 |
1.2 表示学习的研究现状 | 第20-29页 |
1.2.1 自然语言处理领域的表示学习方法 | 第20-21页 |
1.2.2 自然语言处理中的词表示方法 | 第21-24页 |
1.2.3 自然语言处理中的结构表示方法 | 第24-26页 |
1.2.4 结构表示的特例:短语嵌入 | 第26-28页 |
1.2.5 半监督的自然语言结构表示学习 | 第28-29页 |
1.3 论文主要的研究内容 | 第29-33页 |
第2章 基于词表示复合特征的N元词组表示及其应用 | 第33-56页 |
2.1 引言 | 第33-34页 |
2.2 基于词表示的复合特征和n元词组表示 | 第34-38页 |
2.2.1 词嵌入合取信息的重要性 | 第34-36页 |
2.2.2 词嵌入的非线性属性 | 第36-37页 |
2.2.3 词表示复合特征的构成 | 第37-38页 |
2.3 基于n元词组表示的去噪方法 | 第38-46页 |
2.3.1 结构化学习中的噪声问题理论分析 | 第39-44页 |
2.3.2 基于n元词组表示的最近邻去噪算法 | 第44-46页 |
2.4 实验及其结果分析 | 第46-55页 |
2.4.1 词表示复合特征的实验 | 第46-50页 |
2.4.2 基于n元词组表示的去噪实验 | 第50-55页 |
2.5 本章小结 | 第55-56页 |
第3章 通用的结构表示模型FCM | 第56-80页 |
3.1 引言 | 第56-58页 |
3.2 基于表示学习的关系抽取现状分析 | 第58-61页 |
3.2.1 关系抽取现状分析 | 第58-59页 |
3.2.2 表示学习在关系抽取任务上的应用 | 第59-61页 |
3.3 基于丰富特征的结构表示合成模型(FCM) | 第61-67页 |
3.3.1 任意结构输入的子结构分解 | 第61-63页 |
3.3.2 特征与词嵌入的合取 | 第63-65页 |
3.3.3 参数张量和对数双线性模型 | 第65-66页 |
3.3.4 融合模型 | 第66-67页 |
3.4 理解FCM的两个角度 | 第67-70页 |
3.4.1 作为子结构表示的矩阵 | 第67-69页 |
3.4.2 从词汇化特征的角度理解FCM | 第69-70页 |
3.5 模型训练 | 第70-71页 |
3.6 实验及其结果分析 | 第71-79页 |
3.6.1 实验设置 | 第71-74页 |
3.6.2 ACE 2005数据集上的实验结果及分析 | 第74-75页 |
3.6.3 Sem Eval 2010数据集上的实验结果及分析 | 第75-79页 |
3.7 本章小结 | 第79-80页 |
第4章 FCM的低秩近似 | 第80-100页 |
4.1 引言 | 第80-81页 |
4.2 符号和定义 | 第81-83页 |
4.3 基于张量的结构表示及其打分函数 | 第83-85页 |
4.4 基于张量低秩近似的FCM(低秩FCM) | 第85-88页 |
4.4.1 基于Tucker近似的低秩FCM | 第85-86页 |
4.4.2 基于CP近似的低秩FCM | 第86-87页 |
4.4.3 子结构的向量表示 | 第87-88页 |
4.4.4 关于模型参数空间的讨论 | 第88页 |
4.5 处理可变元数的子结构集合 | 第88-90页 |
4.6 从词汇化特征的角度理解低秩FCM | 第90-92页 |
4.7 模型的训练方法 | 第92-94页 |
4.7.1 打分函数的等价形式 | 第92-93页 |
4.7.2 低秩张量模型的随机梯度推导 | 第93-94页 |
4.8 实验及其结果分析 | 第94-99页 |
4.8.1 实验设置 | 第94-96页 |
4.8.2 实验结果 | 第96-99页 |
4.9 本章小结 | 第99-100页 |
第5章 自然语言结构表示的联合训练框架 | 第100-113页 |
5.1 引言 | 第100-101页 |
5.2 基于标记文本和纯文本的表示模型联合训练 | 第101-106页 |
5.2.1 基于目标任务和语言模型的联合训练算法框架 | 第101-104页 |
5.2.2 联合训练方法应用实例:基于纯文本和语义知识库的词嵌入学习 | 第104-106页 |
5.3 实验及其结果分析 | 第106-111页 |
5.3.1 实验设置 | 第106-108页 |
5.3.2 实验结果 | 第108-109页 |
5.3.3 分析 | 第109-111页 |
5.4 本章小结 | 第111-113页 |
第6章 基于低秩FCM和联合训练的短语表示模型 | 第113-132页 |
6.1 引言 | 第113-114页 |
6.2 基于低秩FCM的短语嵌入构建与学习 | 第114-118页 |
6.2.1 短语嵌入的合成模型 | 第114-115页 |
6.2.2 短语嵌入的有监督训练目标 | 第115-116页 |
6.2.3 短语嵌入的联合训练方法 | 第116-118页 |
6.3 任务描述 | 第118-123页 |
6.3.1 数据集 | 第118-120页 |
6.3.2 基线系统 | 第120-122页 |
6.3.3 特征模板和超参数选择 | 第122-123页 |
6.4 实验结果 | 第123-129页 |
6.4.1 二元短语上的实验结果 | 第123-127页 |
6.4.2 讨论:词嵌入维度与模型复杂度 | 第127-128页 |
6.4.3 长短语上的实验结果 | 第128-129页 |
6.5 讨论:细调节词嵌入的作用 | 第129-130页 |
6.6 本章小结 | 第130-132页 |
结论 | 第132-135页 |
参考文献 | 第135-150页 |
附录A 结构化噪声可学习性的证明 | 第150-152页 |
附录B 介词附着任务的实验细节 | 第152-154页 |
附录C 介词消岐任务的特征模板 | 第154-155页 |
附录D 短语相似度任务上的补充实验 | 第155-156页 |
攻读博士学位期间发表的论文及其他成果 | 第156-159页 |
致谢 | 第159-161页 |
个人简历 | 第161页 |