第1章 课题研究的目的与意义 | 第1-20页 |
1.1 知识发现和数据挖掘的概念与发展现状 | 第10-12页 |
1.2 知识发现的过程与数据挖掘的分类 | 第12-14页 |
1.2.1 知识发现的过程 | 第12-13页 |
1.2.2 数据挖掘的分类 | 第13-14页 |
1.3 课题研究的目的与主要研究内容 | 第14-20页 |
1.3.1 课题研究的目的 | 第14-15页 |
1.3.2 关于课题开发工具应用研究的调研 | 第15-19页 |
1.3.3 论文的主要研究内容 | 第19-20页 |
第2章 数据挖掘的数据预处理技术 | 第20-32页 |
2.1 数据清理 | 第20-23页 |
2.1.1 空缺值 | 第20-21页 |
2.1.2 噪声数据 | 第21-23页 |
2.1.3 不一致数据 | 第23页 |
2.2 数据集成和变换 | 第23-26页 |
2.2.1 数据集成 | 第23-24页 |
2.2.2 数据变换 | 第24-26页 |
2.3 数据归约 | 第26-32页 |
2.3.1 数据立方体聚集 | 第26-27页 |
2.3.2 维归约 | 第27-28页 |
2.3.3 离散化和概念分层生成 | 第28-32页 |
第3章 基于回归模型的预测方法 | 第32-39页 |
3.1 多元线性回归 | 第32-34页 |
3.1.1 多元线性回归模型 | 第32-33页 |
3.1.2 参数估计——最小二乘准则 | 第33页 |
3.1.3 假设检验问题 | 第33-34页 |
3.2 曲线回归 | 第34-36页 |
3.3 逐步回归模型 | 第36-39页 |
3.3.1 变量选择问题 | 第36页 |
3.3.2 最优选择的标准 | 第36-37页 |
3.3.3 选择“最优”子集回归的方法 | 第37-39页 |
第4章 聚类分析方法 | 第39-48页 |
4.1 聚类和分类 | 第39页 |
4.2 聚类方法 | 第39-48页 |
4.2.1 类平均法 | 第41页 |
4.2.2 重心法 | 第41-42页 |
4.2.3 最长距离法 | 第42页 |
4.2.4 密度估计法 | 第42-44页 |
4.2.5 最大似然谱系聚类法 | 第44页 |
4.2.6 可变类平均法 | 第44-45页 |
4.2.7 McQuitty相似分析法 | 第45页 |
4.2.8 中间距离法 | 第45页 |
4.2.9 最短距离法 | 第45页 |
4.2.10 两阶段密度估计法 | 第45-46页 |
4.2.11 Ward最小方差法或Ward离差平方和法 | 第46-48页 |
第5章 决策树方法 | 第48-59页 |
5.1 决策树构造算法 | 第48-56页 |
5.1.1 算法的递归过程 | 第48-53页 |
5.1.2 计算information | 第53-54页 |
5.1.3 高分枝数属性的处理 | 第54-56页 |
5.2 决策树构造算法的改进 | 第56-59页 |
5.2.1 定量属性的处理 | 第56-57页 |
5.2.2 缺值情况的处理 | 第57页 |
5.2.3 决策树的剪枝 | 第57-59页 |
第6章 神经网络方法 | 第59-66页 |
6.1 人工神经元与感知器 | 第59-63页 |
6.1.1 人工神经元模型 | 第59-61页 |
6.1.2 感知器及其学习算法 | 第61-63页 |
6.2 人工神经网络模型 | 第63-66页 |
6.2.1 BP神经网络 | 第63-64页 |
6.2.2 RBF神经网络 | 第64-66页 |
第7章 海关执法评估系统的开发与实现 | 第66-101页 |
7.1 系统开发环境及其有关方法 | 第66-86页 |
7.1.1 智能型数据挖掘集成工具SAS/EM | 第67-84页 |
7.1.2 数据挖掘工具SAS/STAT | 第84-86页 |
7.2 海关执法评估系统的功能需求与设计分析 | 第86-88页 |
7.2.1 实际税收水平评估的设计分析 | 第86-87页 |
7.2.2 应税商品聚类分析的设计分析 | 第87页 |
7.2.3 实际入库税收预测的设计分析 | 第87-88页 |
7.3 海关执法评估系统的开发与实现 | 第88-101页 |
7.3.1 实际税收水平评估的开发与实现 | 第88-92页 |
7.3.2 应税商品聚类分析的开发与实现 | 第92-94页 |
7.3.3 实际入库税收预测的开发与实现 | 第94-101页 |
第8章 结论与展望 | 第101-103页 |
致谢 | 第103-104页 |
参考文献 | 第104-105页 |