中文摘要 | 第4-5页 |
英文摘要 | 第5页 |
1 绪论 | 第8-13页 |
1.1 知识发现(KDD)的背景 | 第8-9页 |
1.1.1 知识发现的兴起 | 第8页 |
1.1.2 知识发现的研究内容和过程 | 第8-9页 |
1.2 粗糙集理论 | 第9-11页 |
1.2.1 粗集理论的产生和发展 | 第9-10页 |
1.2.2 粗集理论的特点 | 第10页 |
1.2.3 国内外对粗集理论的研究现状 | 第10-11页 |
1.3 数据预处理研究的意义和目的 | 第11页 |
1.4 本文的主要研究内容 | 第11-12页 |
1.5 本文的组织 | 第12-13页 |
2 粗集的基本理论 | 第13-26页 |
2.1 粗糙集理论的一些基本概念 | 第13-21页 |
2.1.1 知识与分类 | 第13-14页 |
2.1.2 不可分辨关系 | 第14页 |
2.1.3 集合的下近似、上近似及边界区 | 第14-16页 |
2.1.4 非精确数字特征 | 第16-18页 |
2.1.5 知识约简 | 第18-19页 |
2.1.6 知识的依赖性 | 第19-20页 |
2.1.7 知识表达系统 | 第20页 |
2.1.8 决策表 | 第20-21页 |
2.2 粗集模型概述 | 第21-26页 |
2.2.1 概率粗糙集模型 | 第21-22页 |
2.2.2 模糊粗糙集模型 | 第22-23页 |
2.2.3 基于近似随机集的粗糙集模型 | 第23页 |
2.2.4 变精度粗糙集模型 | 第23-24页 |
2.2.5 相似模型 | 第24-26页 |
3 不完备信息系统中的数据补齐 | 第26-44页 |
3.1 不完备信息系统的特点 | 第26-27页 |
3.2 几种数据补齐算法 | 第27-29页 |
3.2.1 非粗集的数据补齐算法 | 第27-28页 |
3.2.2 基于粗集理论的不完备数据补齐算法(ROUSTIDA) | 第28-29页 |
3.3 基于量化相似关系模型的数据补齐 | 第29-33页 |
3.3.1 算法处理流程 | 第30-31页 |
3.3.2 算法应用实例 | 第31-33页 |
3.4 基于受限相似关系模型的数据补齐 | 第33-38页 |
3.4.1 算法处理流程 | 第35-36页 |
3.4.2 算法应用实例 | 第36-38页 |
3.5 基于变精度粗集模型的数据补齐算法 | 第38-43页 |
3.5.1 算法处理流程 | 第40-41页 |
3.5.2 算法应用实例 | 第41-43页 |
3.6 小结 | 第43-44页 |
4 连续属性的离散化研究 | 第44-51页 |
4.1 已有的一些离散化方法的介绍 | 第44-46页 |
4.1.1 非监督离散化 | 第44页 |
4.1.2 监督离散化方法 | 第44-46页 |
4.2 基于粗糙熵的离散化算法 | 第46-50页 |
4.2.1 粗糙熵的相关概念 | 第47-49页 |
4.2.2 算法处理流程 | 第49-50页 |
4.2.3 数值实验 | 第50页 |
4.3 小结 | 第50-51页 |
5 粗集理论的应用 | 第51-57页 |
5.1 电子商务简介 | 第51-53页 |
5.1.1 什么是电子商务 | 第51页 |
5.1.2 电子商务中进行Web数据挖掘的数据源 | 第51-52页 |
5.1.3 电子商务中数据挖掘的现状 | 第52页 |
5.1.4 电子商务挖掘的目的 | 第52-53页 |
5.2 电子商务中潜在客户数据挖掘系统 | 第53-54页 |
5.3 潜在客户挖掘系统应用 | 第54-57页 |
6 结论 | 第57-59页 |
致谢 | 第59-60页 |
参考文献 | 第60-63页 |
附录: 发表的论文及参与的项目 | 第63页 |