中文摘要 | 第2-3页 |
Abstract | 第3-4页 |
第一章 引言 | 第8-12页 |
1.1 研究现状 | 第8页 |
1.2 数据挖掘应用的研究发展及国内外研究动态 | 第8-10页 |
1.2.1 国际上数据挖掘的研究 | 第8-9页 |
1.2.2 中国数据挖掘的研究 | 第9-10页 |
1.2.3 数据挖掘国内外的应用现状 | 第10页 |
1.3 课题来源 | 第10-11页 |
1.3.1 高考招生管理现状 | 第10-11页 |
1.3.2 高考招生信息分析的必要性 | 第11页 |
1.4 论文的组织 | 第11-12页 |
第二章 数据挖掘技术与数据仓库 | 第12-18页 |
2.1 数据挖掘技术简介 | 第12-13页 |
2.1.1 数据挖掘的任务 | 第12-13页 |
2.1.2 数据挖掘与传统分析方法的区别 | 第13页 |
2.2 数据挖掘主要算法 | 第13-14页 |
2.3 数据挖掘处理过程 | 第14-15页 |
2.4 CRISP-DM 模型 | 第15页 |
2.5 数据挖掘技术的应用 | 第15-17页 |
2.6 数据挖掘和数据仓库 | 第17-18页 |
第三章 数据挖掘算法 | 第18-32页 |
3.1 聚类分析 | 第18-19页 |
3.2 聚类分析常用算法分类 | 第19-21页 |
3.2.1 两步聚类 | 第20页 |
3.2.2 K-Means 聚类 | 第20-21页 |
3.2.3 Kohonen 聚类 | 第21页 |
3.3 关联规则 | 第21-23页 |
3.3.1 关联规则 | 第21-22页 |
3.3.2 关联规则挖掘过程 | 第22页 |
3.3.3 关联规则应用 | 第22-23页 |
3.4 关联规则算法 | 第23-24页 |
3.4.1 搜索算法 | 第23页 |
3.4.2 分层搜索的经典算法:Apriori 算法 | 第23-24页 |
3.5 决策树 | 第24-26页 |
3.5.1 决策树的算法过程 | 第25页 |
3.5.2 决策树的优点与缺点 | 第25-26页 |
3.5.3 决策树的评估标准 | 第26页 |
3.5.4 决策树算法与其他相近算法的比较 | 第26页 |
3.6 常用决策树算法 | 第26-29页 |
3.6.1 C&RT | 第27页 |
3.6.2 C5.0 | 第27-28页 |
3.6.3 C&RT 与 C5.0 比较 | 第28页 |
3.6.4 神经网络 | 第28-29页 |
3.7 常用数据挖掘工具软件比较 | 第29-32页 |
3.7.1 SPSS Clementine 介绍 | 第30-32页 |
第四章 招生数据准备 | 第32-38页 |
4.1 定义问题 | 第32-33页 |
4.2 数据准备 | 第33-36页 |
4.2.1 使数据适合数据挖掘 | 第33页 |
4.2.2 检查数据质量 | 第33页 |
4.2.3 对数据进行适当的变换 | 第33-36页 |
4.3 导入数据 | 第36-38页 |
第五章 数据挖掘在招生决策中的应用 | 第38-75页 |
5.1 商业理解 | 第38-40页 |
5.2 数据理解 | 第40-54页 |
5.3 数据准备 | 第54-56页 |
5.4 建模与评估 | 第56-68页 |
5.5 结果发布 | 第68-73页 |
5.6 2009 年招生中应用数据挖掘技术的成果 | 第73-75页 |
结论 | 第75-76页 |
参考文献 | 第76-77页 |
附录 | 第77-86页 |
附录一 图 5-14 所示 07-08 关联规则报到的模型 | 第77-79页 |
附录二 图 5-15 所示 09 数据关联规则模型 | 第79-81页 |
附录三 图 5-29 所示 07-08 数据 C5 | 第81-84页 |
附录四 图 5-31 剪枝参数为 60 的 C5.0 所导出的规则集 | 第84-86页 |
附录五 图 5-38 所示专业倾向剪枝 30RS | 第86页 |