独创性声明 | 第1-5页 |
摘要 | 第5-8页 |
ABSTRACT | 第8-15页 |
第一章 绪论 | 第15-30页 |
·问题的提出及课题的意义 | 第15-17页 |
·研究现状及存在的问题 | 第17-25页 |
·研究目标的确认 | 第17-18页 |
·数据预处理中的属性构造技术 | 第18-19页 |
·决策树分支测度理论 | 第19-22页 |
·决策树分支测度的试验方法 | 第22-24页 |
·数据挖掘预测系统的应用方法论 | 第24-25页 |
·研究方法、路线和设计目标 | 第25-27页 |
·本文组织结构 | 第27-30页 |
第二章 基于决策树的数据挖掘预测模型的基本理论 | 第30-58页 |
·数据挖掘的应用类型:预测和描述 | 第30-31页 |
·数据挖掘过程 | 第31-33页 |
·定义问题 | 第32页 |
·创建、清理数据和数据预处理 | 第32页 |
·产生数据挖掘模型 | 第32-33页 |
·模型确认 | 第33页 |
·模式解释 | 第33页 |
·规则监护 | 第33页 |
·决策树算法 | 第33-38页 |
·基本概念、术语和记法 | 第34-36页 |
·归纳算法 | 第36页 |
·属性选择和分支选择 | 第36-37页 |
·终止条件 | 第37页 |
·噪声与剪枝 | 第37-38页 |
·分支测度及其研究方法、理论 | 第38-55页 |
·简介 | 第38-39页 |
·熵理论 | 第39-40页 |
·不纯度测度理论 | 第40-41页 |
·指数散度测度族和排它偏爱特性 | 第41-42页 |
·类分割测度族 | 第42-44页 |
·21种分支测度 | 第44-55页 |
·本章小结 | 第55-58页 |
第三章 基于时序计数算子的属性构造技术 | 第58-70页 |
·研究意义 | 第58-59页 |
·属性构造原则 | 第59-60页 |
·计数算子 | 第60-62页 |
·时序计数算子 | 第62-65页 |
·时序计数算子的增量算法 | 第65-66页 |
·试验及结果 | 第66-68页 |
·本章小结 | 第68-70页 |
第四章 分支测度的距离理论 | 第70-99页 |
·分支测度与决策树的理论联系 | 第70-74页 |
·分支测度的距离准则 | 第74-88页 |
·分支测度的等价关系 | 第75-76页 |
·分支测度的参数 | 第76-79页 |
·三类距离函数 | 第79-84页 |
·分支测度的线性距离准则 | 第84-86页 |
·分支测度的兴趣倾向与分支测度的广义距离准则 | 第86-88页 |
·广义距离准则与其他分支测度理论的关系 | 第88-94页 |
·概率密度测度与凹距离函数 | 第88-91页 |
·不纯度测度理论 | 第91-92页 |
·指数散度测度族 | 第92-93页 |
·类分割测度族 | 第93-94页 |
·对“针对连续数据”属性选择测度的研究 | 第94-98页 |
·单峰测度 | 第95-96页 |
·RELIEF家族 | 第96-97页 |
·上下文价值测度 | 第97页 |
·可分类性测度 | 第97-98页 |
·本章小结 | 第98-99页 |
第五章 分支测度的遍历式试验方法 | 第99-125页 |
·分支测度的遍历式试验方法 | 第99-100页 |
·重新定义的14种分支测度 | 第100-105页 |
·观测测度曲面的试验 | 第105-108页 |
·试验设计 | 第105-106页 |
·基于简化参数矩阵的数据构造算法 | 第106-107页 |
·试验1的结果 | 第107-108页 |
·试验2和3的结果 | 第108页 |
·测试测度最值和计算复杂度的试验 | 第108-115页 |
·试验设计 | 第108-110页 |
·基于列联表的试验数据构造算法 | 第110-112页 |
·测试最值的试验结果 | 第112-114页 |
·验证Fisher、GD和MDL符合广义距离最小值子准则试验 | 第114页 |
·测试计算复杂度的试验结果 | 第114-115页 |
·测试测度的多分支偏和凹函数性的试验 | 第115-118页 |
·试验设计 | 第115-116页 |
·测试多分支偏的试验结果 | 第116-117页 |
·测试凹函数性的试验结果 | 第117-118页 |
·测试测度优势类偏的试验 | 第118-123页 |
·试验设计 | 第118-120页 |
·试验结果 | 第120-123页 |
·测试总结 | 第123-124页 |
·本章小结 | 第124-125页 |
第六章 海量时序不均衡预测系统的多策略应用框架 | 第125-136页 |
·模型的主要策略 | 第125-126页 |
·与神经元网络杂交的决策树算法 | 第126-128页 |
·全面支持两段式的数据挖掘过程 | 第128-129页 |
·面向不同层次的用户 | 第129-130页 |
·支持过程可视化的多种可视技术 | 第130-131页 |
·在线欺诈识别和计划审计相结合的欺诈识别策略 | 第131页 |
·审计收益代价平衡策略 | 第131-133页 |
·“委任专家”的多分类器预测模型 | 第133-134页 |
·分布式多任务处理模式 | 第134页 |
·本章小结 | 第134-136页 |
第七章 基于决策树的海量时序不均衡预测系统的应用实践 | 第136-145页 |
·应用背景及设计目标 | 第136-137页 |
·数据处理流程 | 第137-138页 |
·系统功能及实现 | 第138-141页 |
·模拟测试 | 第141-143页 |
·测试设计 | 第141-142页 |
·测试结果 | 第142-143页 |
·测试结论 | 第143页 |
·本章小结 | 第143-145页 |
第八章 结束语 | 第145-148页 |
附录A:4.5节试验1的测度曲面 | 第148-150页 |
附录B:4.5节试验2的测度曲面 | 第150-152页 |
附录C:4.5节试验3的测度曲面 | 第152-154页 |
参考文献 | 第154-162页 |
攻读博士期间的主要成果 | 第162-164页 |
致谢 | 第164-165页 |
作者简介 | 第165页 |