内容摘要 | 第5-6页 |
ABSTRACT | 第6页 |
1 引言 | 第10-25页 |
1.1 医疗人工智能的研究现状 | 第10-18页 |
1.1.1 医疗人工智能的定义和要素 | 第10-11页 |
1.1.2 早期的医疗人工智能探索 | 第11-14页 |
1.1.3 医疗人工智能的发展现状 | 第14-15页 |
1.1.4 医疗人工智能的发展 | 第15页 |
1.1.5 医疗人工智能的定位 | 第15-16页 |
1.1.6 常用的辅助诊疗算法 | 第16-18页 |
1.2 罕见疾病的研究现状 | 第18-23页 |
1.2.1 罕见疾病的定义 | 第18页 |
1.2.2 罕见疾病的分布和特点 | 第18-19页 |
1.2.3 组学在罕见疾病研究中的作用 | 第19页 |
1.2.4 罕见疾病的表型和基因型 | 第19-20页 |
1.2.5 目前常用的罕见疾病数据库和词表 | 第20-22页 |
1.2.6 医疗人工智能在罕见疾病领域的发展 | 第22-23页 |
1.3 本文的研究内容及意义 | 第23-25页 |
2 罕见疾病-表型关联预测算法的探究与开发 | 第25-40页 |
2.1 现有的预测算法 | 第25-29页 |
2.1.1 皮尔森相关系数 | 第26-27页 |
2.1.2 余弦相似度 | 第27-28页 |
2.1.3 TF-IDF算法 | 第28-29页 |
2.2 罕见疾病训练集的建立 | 第29页 |
2.3 TF-IDF算法的改进 | 第29-35页 |
2.3.1 卡方检验 | 第31-32页 |
2.3.2 信息增益 | 第32-34页 |
2.3.3 TF-IDF算法与信息增益和卡方检验的融合 | 第34-35页 |
2.4 融合算法 | 第35-38页 |
2.4.1 线性回归方程 | 第36页 |
2.4.2 惩罚整合分析 | 第36-38页 |
2.5 罕见疾病-表型关联预测算法RDPA的基本流程 | 第38-40页 |
3 RDPA算法的性能分析和测试 | 第40-53页 |
3.1 用以比较的算法 | 第40-42页 |
3.1.1 TF-CRF算法 | 第40-41页 |
3.1.2 TF-IDF-CHI算法 | 第41-42页 |
3.2 结果的离散程度 | 第42-47页 |
3.2.1 极差 | 第42-43页 |
3.2.2 方差 | 第43-45页 |
3.2.3 平均差 | 第45-46页 |
3.2.4 变异系数 | 第46-47页 |
3.3 结果召回率 | 第47-49页 |
3.4 输入的表型的数量对结果的影响 | 第49-50页 |
3.5 RDPA算法在公共数据集上的表现 | 第50-53页 |
4 总结与展望 | 第53-56页 |
4.1 总结 | 第53-54页 |
4.2 展望 | 第54-56页 |
参考文献 | 第56-60页 |
附录 | 第60-74页 |
附录1:文本挖掘的相关代码 | 第60-61页 |
附录2:本文所研究的罕见疾病和表型列表(部分) | 第61-65页 |
附录3:RDPA算法所得到的结果(部分) | 第65-73页 |
附录4:公共测试集样例 | 第73-74页 |
研究生在读期间发表文章及所获荣誉 | 第74-75页 |
后记 | 第75-76页 |