粗糙集理论处理海量电子病历的研究与应用
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第10-16页 |
1.1 课题研究背景和研究意义 | 第10-12页 |
1.2 国内外研究现状 | 第12-14页 |
1.3 本文的主要内容与结构安排 | 第14-16页 |
1.3.1 本文主要内容 | 第14页 |
1.3.2 本文结构安排 | 第14-16页 |
第二章 相关理论基础介绍 | 第16-34页 |
2.1 粗糙集理论简介 | 第16-20页 |
2.1.1 知识与不可区分关系 | 第16-17页 |
2.1.2 上近似和下近似 | 第17-18页 |
2.1.3 约简与相对约简 | 第18-20页 |
2.1.4 知识的依赖性 | 第20页 |
2.2 禁忌搜索算法简介 | 第20-25页 |
2.2.1 禁忌搜索算法的基本组成 | 第21-22页 |
2.2.2 禁忌搜索算法的思想 | 第22-23页 |
2.2.3 禁忌搜索算法的执行步骤 | 第23-25页 |
2.3 朴素贝叶斯分类模型简介 | 第25-28页 |
2.3.1 朴素贝叶斯分类器的基本思想 | 第26-27页 |
2.3.2 朴素贝叶斯分类器的学习和分类 | 第27-28页 |
2.4 Hadoop框架简介 | 第28-33页 |
2.4.1 HDFS结构 | 第28-29页 |
2.4.2 HDFS可靠性机制 | 第29-30页 |
2.4.3 MapReduce编程模型 | 第30-31页 |
2.4.4 MapReduce执行流程 | 第31-33页 |
2.5 本章小结 | 第33-34页 |
第三章 粗糙集属性约简算法及改进 | 第34-61页 |
3.1 决策表的约简 | 第34-36页 |
3.2 常见属性约简算法分析对比 | 第36-42页 |
3.2.1 基于区分矩阵的属性约简算法 | 第36-37页 |
3.2.2 基于属性依赖度的属性约简算法 | 第37-38页 |
3.2.3 基于属性重要度的属性约简算法 | 第38-41页 |
3.2.4 算法比较分析 | 第41-42页 |
3.3 属性约简算法优化 | 第42-51页 |
3.3.1 禁忌搜索属性约简算法 | 第42-47页 |
3.3.2 禁忌搜索属性约简算法并行化方案 | 第47-51页 |
3.4 仿真实验对比分析 | 第51-60页 |
3.4.1 仿真数据选取 | 第51-52页 |
3.4.2 仿真实验环境说明 | 第52页 |
3.4.3 仿真实验参数设置 | 第52-53页 |
3.4.4 仿真结果与分析 | 第53-60页 |
3.5 本章小结 | 第60-61页 |
第四章 疾病分类实验与结果评估 | 第61-79页 |
4.1 实验总体流程 | 第61-63页 |
4.2 实验环境搭建 | 第63-66页 |
4.2.1 硬件环境 | 第63页 |
4.2.2 软件环境 | 第63-66页 |
4.2.3 算法准备 | 第66页 |
4.3 实验过程 | 第66-78页 |
4.3.1 数据准备 | 第67-68页 |
4.3.2 海量电子病历文本离散化 | 第68-73页 |
4.3.3 常见疾病属性约简 | 第73-75页 |
4.3.4 常见疾病分类 | 第75-78页 |
4.4 本章小结 | 第78-79页 |
第五章 总结和展望 | 第79-81页 |
5.1 工作总结 | 第79页 |
5.2 研究展望 | 第79-81页 |
参考文献 | 第81-84页 |
致谢 | 第84-85页 |
攻读学位期间的研究成果 | 第85页 |