支持向量机在数据挖掘中的应用
第1章 绪论 | 第1-14页 |
1.1 数据挖掘的国内外研究现状 | 第10-11页 |
1.2 数据挖掘的问题与挑战 | 第11-12页 |
1.2.1 噪音数据 | 第11页 |
1.2.2 不完整数据与冗余信息 | 第11-12页 |
1.2.3 海量数据和高维数据 | 第12页 |
1.3 统计学习与数据挖掘 | 第12页 |
1.4 论文组织 | 第12-14页 |
第2章 数据挖掘概念与技术 | 第14-22页 |
2.1 数据挖掘定义 | 第14-15页 |
2.2 数据挖掘处理过程 | 第15-16页 |
2.2.1 数据准备 | 第15-16页 |
2.2.2 挖掘操作 | 第16页 |
2.2.3 结果解释 | 第16页 |
2.3 分类和预测 | 第16-19页 |
2.3.1 分类问题描述 | 第17页 |
2.3.2 分类器评价尺度 | 第17页 |
2.3.3 分类器构造方法 | 第17-18页 |
2.3.4 预测 | 第18-19页 |
2.4 数据挖掘、机器学习与统计学 | 第19-20页 |
2.5 数据挖掘与统计学习 | 第20-21页 |
2.6 本章小结 | 第21-22页 |
第3章 统计学习理论 | 第22-33页 |
3.1 学习问题描述 | 第22-23页 |
3.2 损失函数和风险最小化 | 第23页 |
3.3 经验风险最小化归纳原则 | 第23-24页 |
3.4 ERM的一致收敛问题 | 第24-27页 |
3.5 函数集的VC维与风险的界 | 第27-30页 |
3.5.1 指示函数集的VC维 | 第27-28页 |
3.5.2 实函数集的VC维 | 第28页 |
3.5.3 风险的概念性的界 | 第28-29页 |
3.5.4 构造性的与分布无关的界 | 第29-30页 |
3.6 结构风险最小化归纳原则 | 第30-32页 |
3.7 本章小结 | 第32-33页 |
第4章 支持向量机 | 第33-50页 |
4.1 n维向量空间与点积 | 第33-34页 |
4.2 线性可分情况下的分类超平面 | 第34-39页 |
4.2.1 规范的分类超平面与间隔 | 第35-37页 |
4.2.2 分类错误的界 | 第37-38页 |
4.2.3 最优分类超平面 | 第38-39页 |
4.3 训练数据不可分与软间隔技术 | 第39-41页 |
4.4 非线性可分:核函数替代 | 第41-47页 |
4.4.1 核函数映射 | 第42-44页 |
4.4.2 SVM训练中的核函数替代 | 第44-46页 |
4.4.3 SVM与结构风险最小化 | 第46页 |
4.4.4 多项式学习机器 | 第46-47页 |
4.4.5 径向基函数学习机器 | 第47页 |
4.5 模型选择 | 第47-49页 |
4.6 本章小结 | 第49-50页 |
第5章 可处理大数据集的SVM训练算法 | 第50-64页 |
5.1 优化问题 | 第50-52页 |
5.2 二次规划 | 第52-55页 |
5.3 SVM训练中的KKT条件 | 第55-56页 |
5.4 分解(Decomposition) | 第56-59页 |
5.4.1 分解算法 | 第57-58页 |
5.4.2 一个启发式方法 | 第58-59页 |
5.5 基于可行方向的分解算法 | 第59-63页 |
5.5.1 最优工作集选择 | 第61-62页 |
5.5.2 停止准则 | 第62-63页 |
5.5.3 算法的计算复杂性分析 | 第63页 |
5.6 本章小结 | 第63-64页 |
第6章 SVM在抽油机泵况分析中的应用 | 第64-72页 |
6.1 抽油机泵参调整数据挖掘系统 | 第64-66页 |
6.1.1 系统体系结构 | 第64-65页 |
6.1.2 数据预处理 | 第65页 |
6.1.3 挖掘操作 | 第65页 |
6.1.3 决策支持 | 第65-66页 |
6.2 现有的泵况分类方法 | 第66-69页 |
6.2.1 泵效与沉没度的相关性 | 第66-69页 |
6.2.2 统计分析技术 | 第69页 |
6.3 基于SVM的泵况分类法 | 第69-71页 |
6.3.1 核函数选择 | 第69-70页 |
6.3.2 参数设置 | 第70页 |
6.3.3 可视化 | 第70页 |
6.3.4 实验结果分析 | 第70-71页 |
6.4 本章小结 | 第71-72页 |
结论与展望 | 第72-74页 |
参考文献 | 第74-78页 |
攻读硕士学位期间发表的论文及所取得的科研成果 | 第78-79页 |
致谢 | 第79页 |