| 摘要 | 第1-5页 |
| Abstract | 第5-14页 |
| 第1章 绪论 | 第14-34页 |
| ·课题背景及意义 | 第14-17页 |
| ·国内外研究现状 | 第17-25页 |
| ·生物医学名实体识别 | 第18-20页 |
| ·同义词与缩略语识别 | 第20-22页 |
| ·生物医学实体规范化 | 第22-23页 |
| ·生物医学关系抽取 | 第23-24页 |
| ·生物医学文献分类 | 第24页 |
| ·假设生成 | 第24-25页 |
| ·生物医学语言学资源 | 第25-30页 |
| ·语料库资源 | 第25-27页 |
| ·词典及本体知识库 | 第27-29页 |
| ·生物医学文本挖掘的相关评测 | 第29-30页 |
| ·本文的研究内容 | 第30-32页 |
| ·本文的内容安排 | 第32-34页 |
| 第2章 基于条件随机域的生物医学名实体识别 | 第34-54页 |
| ·引言 | 第34-35页 |
| ·问题定义 | 第35-37页 |
| ·生物医学名实体特点 | 第35-36页 |
| ·生物医学实体识别的研究进展 | 第36-37页 |
| ·模型介绍 | 第37-42页 |
| ·最大熵模型 | 第38-40页 |
| ·条件随机域模型 | 第40-42页 |
| ·生物医学名实体识别流程及所采用的特征 | 第42-45页 |
| ·浅层句法特征 | 第43-44页 |
| ·其他特征 | 第44-45页 |
| ·实验数据集 | 第45-48页 |
| ·JNLPBA2004 数据集 | 第45-47页 |
| ·BioCreAtIvE 数据集 | 第47-48页 |
| ·实验结果 | 第48-53页 |
| ·在JNLPBA2004 数据集上的实验结果 | 第48-52页 |
| ·在BioCreAtIvE 数据集上的实验结果 | 第52-53页 |
| ·本章小结 | 第53-54页 |
| 第3章 基于最大熵的协同训练在生物医学实体识别中的应用 | 第54-70页 |
| ·引言 | 第54页 |
| ·半监督学习 | 第54-59页 |
| ·半监督学习的理论分析 | 第55-57页 |
| ·半监督学习的常用方法 | 第57-59页 |
| ·主动学习 | 第59-60页 |
| ·主动学习的定义 | 第59页 |
| ·主动学习的分类 | 第59-60页 |
| ·基于协同训练方法的生物医学名实体识别 | 第60-66页 |
| ·协同训练 | 第60-63页 |
| ·基于最大熵模型的协同训练 | 第63-64页 |
| ·实验设置及实验结果 | 第64-66页 |
| ·协同训练和主动学习相结合的生物医学名实体识别 | 第66-67页 |
| ·本章小结 | 第67-70页 |
| 第4章 基于多层歧义消解策略的生物医学实体规范化研究 | 第70-86页 |
| ·引言 | 第70-71页 |
| ·基因名字规范化问题定义 | 第71-72页 |
| ·相关工作 | 第72-73页 |
| ·基因名字规范化的多层歧义消解 | 第73-81页 |
| ·基于词典匹配的基因名字识别 | 第73页 |
| ·基于最大熵模型的候选选择 | 第73-76页 |
| ·基于知识的歧义消解 | 第76-81页 |
| ·实验结果 | 第81-85页 |
| ·数据集 | 第81-82页 |
| ·评价方法 | 第82-83页 |
| ·实验结果与分析 | 第83-84页 |
| ·与其他工作的比较 | 第84-85页 |
| ·本章小结 | 第85-86页 |
| 第5章 生物医学语义关系抽取研究 | 第86-103页 |
| ·引言 | 第86页 |
| ·生物医学语义关系抽取的研究进展 | 第86-88页 |
| ·蛋白质相互作用信息抽取 | 第88-93页 |
| ·BC?PPI语料库 | 第89-90页 |
| ·基于最大熵的二阶段蛋白质相互作用关系抽取 | 第90-92页 |
| ·实验结果 | 第92-93页 |
| ·蛋白质相互作用关系分类 | 第93-100页 |
| ·实验数据集 | 第94-96页 |
| ·基于最大熵模型的蛋白质相互作用分类 | 第96-98页 |
| ·实验结果与分析 | 第98-100页 |
| ·疾病和治疗方式关系抽取 | 第100-101页 |
| ·实验数据集 | 第100页 |
| ·实验结果 | 第100-101页 |
| ·本章小结 | 第101-103页 |
| 结论 | 第103-106页 |
| 参考文献 | 第106-118页 |
| 攻读博士学位期间发表的学术论文 | 第118-120页 |
| 致谢 | 第120-121页 |
| 个人简历 | 第121页 |