摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
主要符号表 | 第15-16页 |
1 绪论 | 第16-35页 |
1.1 研究背景与意义 | 第16-17页 |
1.2 生物医学文本挖掘研究进展 | 第17-19页 |
1.2.1 信息检索 | 第17-18页 |
1.2.2 实体识别 | 第18-19页 |
1.2.3 指代消解 | 第19页 |
1.3 生物医学关系抽取的研究现状和存在的问题 | 第19-28页 |
1.3.1 蛋白质关系抽取 | 第20-23页 |
1.3.2 化合物疾病关系抽取 | 第23-25页 |
1.3.3 药物关系抽取 | 第25-26页 |
1.3.4 事件抽取 | 第26-27页 |
1.3.5 关系抽取任务中目前存在的问题 | 第27-28页 |
1.4 词表示和深度学习技术的研究进展 | 第28-33页 |
1.4.1 词表示 | 第29-31页 |
1.4.2 文本挖掘领域的深度学习 | 第31-33页 |
1.5 本文主要研究思路与内容 | 第33-35页 |
2 融合丰富信息的词表示模型 | 第35-59页 |
2.1 引言 | 第35-43页 |
2.1.1 分布式词表示 | 第36-37页 |
2.1.2 神经网络语言模型 | 第37-39页 |
2.1.3 RNNLM | 第39页 |
2.1.4 Skip-gram和CBOW模型 | 第39-43页 |
2.1.5 GloVe模型 | 第43页 |
2.2 融合丰富信息的分布式词表示模型 | 第43-48页 |
2.2.1 生物医学文本的获取 | 第44页 |
2.2.2 切词 | 第44-45页 |
2.2.3 生物医学文本解析 | 第45-47页 |
2.2.4 词向量的训练 | 第47-48页 |
2.2.5 扩展目标 | 第48页 |
2.3 实验及分析 | 第48-57页 |
2.3.1 词向量训练设置 | 第49页 |
2.3.2 蛋白质关系抽取的语料与方法 | 第49-50页 |
2.3.3 性能度量 | 第50-53页 |
2.3.4 不同领域词向量的比较 | 第53-54页 |
2.3.5 同领域不同规模背景语料对词向量的影响 | 第54-56页 |
2.3.6 与其他蛋白质关系抽取方法的比较 | 第56-57页 |
2.4 本章小结 | 第57-59页 |
3 针对蛋白质关系抽取的二分类实例表示模型 | 第59-81页 |
3.1 引言 | 第59-68页 |
3.1.1 逻辑回归 | 第62-63页 |
3.1.2 支持向量机 | 第63-66页 |
3.1.3 神经网络 | 第66-68页 |
3.2 基于实例表示的蛋白质间二分类关系抽取模型 | 第68-71页 |
3.2.1 预处理 | 第68页 |
3.2.2 蛋白质关系实例表示 | 第68-70页 |
3.2.3 分类器 | 第70-71页 |
3.3 实验与分析 | 第71-80页 |
3.3.1 任务及评价方法介绍 | 第71-73页 |
3.3.2 蛋白质关系抽取任务上的实验 | 第73-79页 |
3.3.3 化合物疾病关系抽取任务上的评价 | 第79页 |
3.3.4 药物关系抽取任务上的评价 | 第79-80页 |
3.4 本章小结 | 第80-81页 |
4 针对药物关系抽取的两阶段方法 | 第81-99页 |
4.1 引言 | 第81-87页 |
4.1.1 LSTM | 第83-84页 |
4.1.2 双向LSTM | 第84页 |
4.1.3 Dropout | 第84-85页 |
4.1.4 Maxout | 第85-86页 |
4.1.5 Highway | 第86-87页 |
4.2 基于LR-LSTM的两阶段药物关系抽取 | 第87-93页 |
4.2.1 第一阶段:基于LR的二类分类 | 第87-90页 |
4.2.2 第二阶段:基于LSTM的多类分类 | 第90-93页 |
4.3 实验与分析 | 第93-98页 |
4.3.1 任务介绍 | 第94页 |
4.3.2 评价方法 | 第94页 |
4.3.3 基线系统 | 第94-95页 |
4.3.4 LSTM层数和词性向量的影响 | 第95-96页 |
4.3.5 双向LSTM的影响 | 第96页 |
4.3.6 过采样和两阶段的影响 | 第96-97页 |
4.3.7 多层双向LSTM和Dropout的影响 | 第97页 |
4.3.8 与其他方法的比较 | 第97-98页 |
4.4 本章小节 | 第98-99页 |
5 结论与展望 | 第99-102页 |
5.1 结论 | 第99-100页 |
5.2 创新点 | 第100页 |
5.3 展望 | 第100-102页 |
参考文献 | 第102-114页 |
攻读博士学位期间科研项目及科研成果 | 第114-116页 |
致谢 | 第116-117页 |
作者简介 | 第117页 |