基于Hadoop的粗糙集快速属性约简

摘要	第1-6页
ABSTRACT	第6-9页
第一章绪论	第9-13页
·课题背景与研究意义	第9-10页
·大数据处理以及属性约简的发展现状	第10-12页
·大数据处理技术的研究现状	第10-11页
·粗糙集理论和属性约简的研究现状	第11-12页
·文章组织结构	第12-13页
第二章粗糙集以及属性约简方法相关知识	第13-26页
·粗糙集理论	第13-16页
·粗糙集理论基本概念	第13-15页
·粗糙集理论决策信息系统	第15-16页
·邻域粗糙集理论	第16-19页
·邻域粗糙集	第16-18页
·基于邻域粗糙集的属性约简	第18-19页
·属性评价方法	第19-23页
·特征选择过程	第19-20页
·基于依赖度的属性评价方法	第20-21页
·基于一致性的属性评价方法	第21-22页
·其他评价方法	第22-23页
·搜索策略	第23页
·基于邻域粗糙集的依赖度评价方法的属性约简算法设计	第23-24页
·大数据的属性约简面临的问题分析	第24-25页
·本章小结	第25-26页
第三章 HADOOP技术应用	第26-34页
·开源云平台 HADOOP	第26-28页
·HIVE	第28-29页
·基于 HADOOP的分布式数据挖掘框架	第29-30页
·典型的日志分析事务实现	第30-32页
·性能分析	第32-33页
·本章小结	第33-34页
第四章基于 MAPREDUCE 模型的并行机器学习算法研究	第34-45页
·MAPREDUCE相关知识介绍	第34-37页
·MAPREDUCE与其他系统相比	第35-36页
·MAPREDUCE工作机制	第36-37页
·MAPREDUCE编程模型	第37-39页
·链接 MAPREDUCE	第39-40页
·基于 MAPREDUCE 的并行贝叶斯算法	第40-43页
·朴素贝叶斯分类器	第40-41页
·并行贝叶斯算法设计和实现	第41-43页
·基于 MAPREDUCE 的并行属性约简算法性能分析	第43-44页
·本章小结	第44-45页
第五章基于 HADOOP的粗糙集属性约简算法的实现	第45-64页
·粗糙集属性约简算法并行化分析	第45页
·粗糙集属性约简算法并行化实现	第45-49页
·属性约简的算法的 MAPREDUCE框架	第45-46页
·属性约简算法的 MAPREDUCE 算法设计	第46-49页
·并行算法实现的关键技术	第49-57页
·自定义 KEY和 VALUE数据类型	第49-53页
·输入和输出格式	第53-54页
·全局变量	第54-55页
·使用 COMBINER 提升性能	第55-56页
·选择 REDUCER 的个数	第56-57页
·实验分析	第57-63页
·构建 HADOOP集群	第58-61页
·实验数据准备	第61页
·实验结果分析	第61-63页
·本章小结	第63-64页
第六章总结和展望	第64-66页
·总结	第64页
·下一步研究方向	第64-66页
致谢	第66-67页
参考文献	第67-71页
附录作者在读期间发表的学术论文及参加的科研项目	第71页