基于文本挖掘的基因—疾病关联关系研究

摘要	第5-6页
Abstract	第6-7页
第一章绪论	第10-14页
1.1 生物信息学	第10-11页
1.2 基因-疾病关联关系及其预测	第11-12页
1.3 国内外研究现状	第12-13页
1.4 本文结构	第13-14页
第二章基因-疾病关联关系预测的相关方法和技术	第14-21页
2.1 图论和机器学习模型	第14-16页
2.2 文本挖掘方法	第16-17页
2.3 co-occurrence模型	第17-19页
2.4 TF-IDF模型	第19-20页
2.5 本章小结	第20-21页
第三章基因-疾病关联关系的文本挖掘策略	第21-27页
3.1 基本模型与概念	第21页
3.2 数据来源	第21-24页
3.3 数据处理的TF-IDF模型	第24-26页
3.4 本章小结	第26-27页
第四章数据处理	第27-46页
4.1 数据处理流程概述	第27-28页
4.2 基因、疾病列表构建	第28-30页
4.3 字典构建	第30-31页
4.4 疾病名称规范化表示	第31-32页
4.5 文档集构建	第32-37页
4.6 关键词匹配	第37-38页
4.7 单文档向量化	第38-40页
4.8 计算IDF	第40-42页
4.9 向量构建	第42-43页
4.10 余弦相似性计算	第43页
4.11 验证方法	第43-45页
4.12 本章小结	第45-46页
第五章结果分析	第46-60页
5.1 实验结果	第46-50页
5.2 不同参数选择的影响	第50-55页
5.3 与其他方法的比较	第55-59页
5.4 本章小结	第59-60页
第六章总结与讨论	第60-63页
6.1 方法总结	第60-61页
6.2 结果数据的应用价值	第61-62页
6.3 本章小结	第62-63页
结论	第63-64页
参考文献	第64-69页
攻读硕士学位期间取得的研究成果	第69-70页
致谢	第70-71页
附件	第71页