摘要 | 第5-6页 |
abstract | 第6-7页 |
第一章 绪论 | 第11-17页 |
1.1 课题研究的背景与意义 | 第11-12页 |
1.2 国内外研究现状 | 第12-13页 |
1.2.1 医疗大数据的国内外研究现状 | 第12-13页 |
1.2.2 医疗大数据预处理技术的国内外研究现状 | 第13页 |
1.3 论文的研究内容与创新 | 第13-15页 |
1.3.1 本文的研究内容 | 第14页 |
1.3.2 本文的创新点 | 第14-15页 |
1.4 本论文的结构安排 | 第15-17页 |
第二章 健康大数据预处理技术研究综述 | 第17-23页 |
2.1 医疗数据预处理的必要性 | 第17-18页 |
2.2 数据清洗 | 第18-20页 |
2.2.1 重复数据检测的常用算法 | 第19页 |
2.2.2 孤立点检测的常用算法 | 第19页 |
2.2.3 特征选择的常用算法 | 第19-20页 |
2.3 数据集成 | 第20页 |
2.3.1 模式集成方法 | 第20页 |
2.3.2 数据复制方法 | 第20页 |
2.3.3 综合性集成方法 | 第20页 |
2.4 数据归约 | 第20-21页 |
2.5 数据变换 | 第21页 |
2.6 数据预处理的检验模型 | 第21-22页 |
2.7 本章小结 | 第22-23页 |
第三章 健康大数据重复数据清洗技术研究与改进 | 第23-39页 |
3.1 引言 | 第23页 |
3.2 重复数据检测现有技术分析 | 第23-25页 |
3.3 针对医疗数据的重复数据检测算法改进 | 第25-31页 |
3.3.1 现有方法对医疗数据进行重复数据检测的问题研究 | 第25-26页 |
3.3.2 相关算法分析及改进 | 第26-31页 |
3.4 实验结果及分析 | 第31-38页 |
3.4.1 实验数据说明 | 第31页 |
3.4.2 重复数据检测技术性能评价指标 | 第31-32页 |
3.4.3 实验结果 | 第32-34页 |
3.4.4 实验分析 | 第34-38页 |
3.5 本章小结 | 第38-39页 |
第四章 健康大数据异常数据检测方法的研究与改进 | 第39-54页 |
4.1 引言 | 第39页 |
4.2 异常点检测现有算法分析 | 第39-41页 |
4.3 健康数据集改进算法中相关算法分析 | 第41-44页 |
4.3.1 基于密度的孤立点检测算法 | 第41-43页 |
4.3.2 K-Means聚类算法分析 | 第43-44页 |
4.4 基于健康数据的孤立点检测算法改进 | 第44-48页 |
4.4.1 基于投票策略的全局孤立点检测 | 第44-45页 |
4.4.2 基于k-means的最近、最远域搜索 | 第45-47页 |
4.4.3 改进算法详细步骤 | 第47-48页 |
4.5 基于健康数据集的孤立点检测实验结果及分析 | 第48-52页 |
4.5.1 实验设计及实验评价指标 | 第48-49页 |
4.5.2 改进算法执行效率的实验 | 第49-50页 |
4.5.3 实验结果分析 | 第50-52页 |
4.6 本章小结 | 第52-54页 |
第五章 健康数据集中数据规约算法的研究与改进 | 第54-66页 |
5.1 引言 | 第54页 |
5.2 现代特征选择算法研究 | 第54-56页 |
5.2.1 特征子集搜索算法 | 第55-56页 |
5.2.2 评价函数 | 第56页 |
5.3 针对健康数据集基于随机森林的特征选择算法的改进 | 第56-61页 |
5.3.1 随机森林算法的介绍 | 第56-58页 |
5.3.2 基于随机森林的特征选择算法 | 第58-60页 |
5.3.3 基于局部重要度的特征选择算法的改进 | 第60-61页 |
5.4 实验结果与分析 | 第61-64页 |
5.4.1 实验设计 | 第61页 |
5.4.2 实验结果 | 第61-62页 |
5.4.3 实验分析 | 第62-64页 |
5.5 本章小结 | 第64-66页 |
第六章 健康大数据预处理系统的设计与实现 | 第66-79页 |
6.1 总体设计 | 第66-68页 |
6.2 数据预处理系统 | 第68-76页 |
6.2.1 数据集介绍 | 第68-69页 |
6.2.2 完整性、一致性检测 | 第69-70页 |
6.2.3 重复数据检测 | 第70-71页 |
6.2.4 孤立点检测 | 第71-73页 |
6.2.5 特征选择 | 第73-76页 |
6.3 数据分析系统 | 第76-78页 |
6.3.1 参数选择模块 | 第77页 |
6.3.2 结果显示模块 | 第77-78页 |
6.3.3 个例判定模块 | 第78页 |
6.4 本章小结 | 第78-79页 |
第七章 全文总结与展望 | 第79-82页 |
7.1 全文总结 | 第79-80页 |
7.2 未来展望 | 第80-82页 |
致谢 | 第82-83页 |
参考文献 | 第83-87页 |
攻读硕士学位期间取得的成果 | 第87页 |