生物医学文本的标注与检索研究

摘要	第5-6页
ABSTRACT	第6页
第一章绪论	第9-15页
1.1 研究的背景和意义	第9-10页
1.2 国内外研究的历史与现状	第10-13页
1.2.1 生物医学检索的特殊性	第10-11页
1.2.2 生物医学信息检索的发展	第11-12页
1.2.3 生物医学文本标注与检索	第12-13页
1.3 本文研究的主要内容与贡献	第13-14页
1.4 本文的结构	第14-15页
第二章相关理论及工具	第15-28页
2.1 信息检索的基本流程	第15-16页
2.2 基本检索模型	第16-19页
2.2.1 布尔模型	第16页
2.2.2 概率模型	第16-17页
2.2.3 向量空间模型	第17-18页
2.2.4 统计语言模型	第18-19页
2.3 检索性能的评价	第19-20页
2.4 多标签学习基本理论	第20-23页
2.4.1 多标签学习简介	第20页
2.4.2 常用的多标签算法	第20-22页
2.4.3 多标签学习的评价指标	第22-23页
2.5 医学本体	第23-26页
2.5.1 UMLS	第23-25页
2.5.2 MeSH	第25-26页
2.5.3 MEDLINE	第26页
2.6 使用平台工具	第26-27页
2.6.1 Lemur/Indri	第26-27页
2.6.2 MetaMap	第27页
2.7 本章小结	第27-28页
第三章基于本体查询扩展的噪声控制	第28-47页
3.1 基于本体查询扩展存在的问题	第28-29页
3.2 三种噪声控制方法	第29-35页
3.2.1 基于短语的检索	第29-33页
3.2.1.1 短语的识别	第29-30页
3.2.1.2 短语的表示	第30页
3.2.1.3 基于单词检索模型	第30-31页
3.2.1.4 基于短语检索模型	第31-32页
3.2.1.5 混合检索模型	第32-33页
3.2.2 扩展词加权	第33-34页
3.2.3 扩展词过滤	第34-35页
3.3 实验	第35-44页
3.3.1 OHSUMED数据集的检索	第36-40页
3.3.1.1 基于单词模型的实验	第36-38页
3.3.1.2 基于短语模型的实验	第38-39页
3.3.1.3 混合模型的实验	第39-40页
3.3.2 TREC-Genomic数据集的检索	第40-44页
3.3.2.1 基于单词模型的实验	第41-42页
3.3.2.2 基于短语模型的实验	第42-44页
3.3.2.3 混合模型的实验	第44页
3.4 实验结论与分析	第44-45页
3.5 本章小结	第45-47页
第四章基于CCA的医学文本标注	第47-64页
4.1 CCA基本理论	第47-49页
4.2 基于CCA标注方法	第49-51页
4.3 CCA实验	第51-61页
4.3.1 Emotions数据集CCA标注实验	第51-53页
4.3.2 Yeast数据集CCA标注实验	第53-55页
4.3.3 Image数据集CCA标注实验	第55-56页
4.3.4 OHSUMED数据集MeSH标注实验	第56-61页
4.4 实验结论与分析	第61-63页
4.5 本章小结	第63-64页
第五章结论与展望	第64-66页
5.1 本文的主要工作与结论	第64-65页
5.2 工作的展望	第65-66页
致谢	第66-67页
参考文献	第67-71页