摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第11-18页 |
1.1 研究背景和意义 | 第11-12页 |
1.2 国内外研究现状 | 第12-15页 |
1.2.1 关联规则的研究现状 | 第12-14页 |
1.2.2 关联规则的商业应用 | 第14-15页 |
1.3 论文的主要内容 | 第15-16页 |
1.4 论文的章节安排 | 第16-18页 |
第二章 相关理论和技术 | 第18-33页 |
2.1 数据挖掘的相关概念 | 第18-22页 |
2.1.1 数据处理相关方法 | 第18-21页 |
2.1.2 数据挖掘系统 | 第21-22页 |
2.2 关联规则的相关概念 | 第22-24页 |
2.2.1 关联规则的基本概念 | 第22-23页 |
2.2.2 关联规则挖掘的分类 | 第23-24页 |
2.2.3 关联规则的挖掘过程 | 第24页 |
2.3 关联规则挖掘算法 | 第24-30页 |
2.3.1 Apriori算法 | 第24-26页 |
2.3.2 FP-growth算法 | 第26-30页 |
2.4 Hadoop平台介绍 | 第30-32页 |
2.4.1 并行计算框架MapReduce | 第31-32页 |
2.4.2 分布式文件系统HDFS | 第32页 |
2.5 本章小结 | 第32-33页 |
第三章 并行FP-growth关联规则算法改进 | 第33-61页 |
3.1 基于FP-growth的并行化方法 | 第33-39页 |
3.1.1 并行化基本思想 | 第33-35页 |
3.1.2 并行FP-growth算法的设计 | 第35-39页 |
3.1.3 传统并行化算法的问题 | 第39页 |
3.2 节点负载优化算法 | 第39-45页 |
3.2.1 基于Hash的分组策略 | 第40-41页 |
3.2.2 基于贪心策略的负载优化算法 | 第41-45页 |
3.3 节点通信量优化算法 | 第45-51页 |
3.3.1 节点通信量优化模型 | 第45-49页 |
3.3.2 基于通信量优化的FP-growth并行算法 | 第49-51页 |
3.4 基于MapReduce的TFP算法设计 | 第51-56页 |
3.4.1 算法流程 | 第51-52页 |
3.4.2 具体实现 | 第52-56页 |
3.5 基于Hadoop平台的TFP算法的实验 | 第56-60页 |
3.5.1 集群环境及数据说明 | 第56页 |
3.5.2 数据说明 | 第56-57页 |
3.5.3 实验结果和分析 | 第57-60页 |
3.6 本章小结 | 第60-61页 |
第四章 并行FP-growth在财务风险分析中的应用 | 第61-72页 |
4.1 财务数据筛选 | 第61-67页 |
4.1.1 企业数据的筛选 | 第61-63页 |
4.1.2 财务指标系统 | 第63-65页 |
4.1.3 财务风险分析中指标的选择 | 第65-67页 |
4.2 企业财务数据预处理 | 第67-69页 |
4.2.1 指标相关性分析 | 第67-68页 |
4.2.2 指标数据的异常检测和离散化 | 第68-69页 |
4.3 基于并行FP-growth的财务数据分析 | 第69-71页 |
4.3.1 挖掘实现 | 第69-70页 |
4.3.2 基于并行FP-growth的频繁项集挖掘 | 第70页 |
4.3.3 基于并行FP-growth的关联规则挖掘 | 第70-71页 |
4.4 本章小结 | 第71-72页 |
第五章 基于并行FP-growth的企业财务风险分析系统 | 第72-85页 |
5.1 企业财务风险分析的系统背景分析 | 第72-73页 |
5.2 企业财务风险分析系统需求分析 | 第73-75页 |
5.2.1 必要性与可行性分析 | 第73页 |
5.2.2 功能需求分析 | 第73-74页 |
5.2.3 性能需求分析 | 第74页 |
5.2.4 运行需求分析 | 第74-75页 |
5.3 企业财务风险分析系统的设计 | 第75-79页 |
5.3.1 系统设计思路 | 第75-76页 |
5.3.2 系统整体架构设计 | 第76-77页 |
5.3.3 功能模块设计 | 第77-79页 |
5.4 企业财务风险分析系统功能展示 | 第79-82页 |
5.5 企业财务风险分析系统测试与分析 | 第82-84页 |
5.6 本章小结 | 第84-85页 |
第六章 总结与展望 | 第85-87页 |
6.1 全文工作总结 | 第85-86页 |
6.2 未来工作展望 | 第86-87页 |
致谢 | 第87-88页 |
参考文献 | 第88-91页 |