摘要 | 第1-6页 |
Abstract | 第6-14页 |
第一章 绪论 | 第14-24页 |
第一节 选题的研究背景和研究意义 | 第14-15页 |
第二节 相关背景知识 | 第15-19页 |
一、数据挖掘的发展概况 | 第15-17页 |
二、数据归约的主要内容 | 第17-18页 |
三、数据归约的重要作用 | 第18-19页 |
第三节 国内外研究现状 | 第19-21页 |
一、属性离散化方法研究的现状 | 第19-20页 |
二、属性排序和属性子集选择方法研究的现状 | 第20-21页 |
第四节 论文的研究内容及创新点 | 第21-24页 |
一、论文的研究内容和结构 | 第21-23页 |
二、论文的创新点 | 第23-24页 |
第二章 缺失值的填补与异常值的探测 | 第24-44页 |
第一节 缺失值的填补 | 第24-28页 |
一、单一填补法和多重填补法 | 第24-26页 |
二、基于距离的填补方法 | 第26-27页 |
三、贝叶斯填补方法 | 第27-28页 |
第二节 异常值的探测 | 第28-37页 |
一、异常值及形成原因 | 第29页 |
二、异常值的探测方法 | 第29-36页 |
三、异常值探测的步骤及应用 | 第36-37页 |
第三节 移动通讯用户消费行为的分析 | 第37-44页 |
一、单个属性异常值探测的应用及分析 | 第38-41页 |
二、多个属性的异常值探测方法的应用及分析 | 第41-44页 |
第三章 数据挖掘中元组的归约 | 第44-64页 |
第一节 面向属性归纳 | 第44-47页 |
一、面向属性归纳 | 第44-45页 |
二、面向属性归纳的步骤 | 第45-46页 |
三、面向属性归纳的算法 | 第46-47页 |
第二节 连续属性离散化方法及分类 | 第47-54页 |
一、离散化方法的分类 | 第47-48页 |
二、典型离散化的过程及结果评价 | 第48-49页 |
三、相关的离散化方法 | 第49-54页 |
第三节 基于可辨识矩阵的连续属性离散化方法 | 第54-60页 |
一、基于可辨识矩阵离散化方法的基本思路 | 第54-56页 |
二、基于可辨识矩阵离散化方法的框架 | 第56-57页 |
三、基于可辨识矩阵离散化方法的统计模拟 | 第57-60页 |
第四节 基于似然比假设检验的连续属性离散化方法 | 第60-64页 |
一、基于似然比假设检验的离散化方法 | 第60-61页 |
二、基于似然比假设检验离散化方法的步骤 | 第61-62页 |
三、基于似然比假设检验离散化方法的验证 | 第62-63页 |
四、两种离散化方法结果的比较 | 第63-64页 |
第四章 属性重要性的排序 | 第64-85页 |
第一节 有监督属性重要性的排序 | 第64-71页 |
一、粗糙集理论中属性重要性的排序方法 | 第64-66页 |
二、信息论和决策树中属性重要性的排序方法 | 第66-68页 |
三、神经网络中属性重要性的排序方法 | 第68-70页 |
四、三种方法的比较 | 第70-71页 |
第二节 单向有序列联资料的属性重要性的排序 | 第71-79页 |
一、单向有序列联表 | 第71-73页 |
二、以秩效应为标准的方法 | 第73页 |
三、改进秩和法 | 第73-74页 |
四、改进秩和法对一份调查问卷的分析 | 第74-77页 |
五、以秩效应为标准的方法和改进秩和法的比较 | 第77-79页 |
第三节 基于因子分析的无监督属性重要性的排序 | 第79-85页 |
一、基于因子分析的属性重要性排序方法 | 第79-80页 |
二、基于因子分析的属性重要性排序方法的步骤 | 第80-81页 |
三、基于因子分析排序方法的框架 | 第81-82页 |
四、基于因子分析属性重要性排序方法的验证 | 第82-83页 |
五、值得注意的问题和局限性 | 第83-85页 |
第五章 属性的提取与属性子集的选择 | 第85-107页 |
第一节 属性的提取 | 第85-92页 |
一、小波变换 | 第85-87页 |
二、投影寻踪 | 第87-88页 |
三、多维标度 | 第88-91页 |
四、多元统计分析方法 | 第91页 |
五、几种属性提取方法的比较 | 第91-92页 |
第二节 属性子集的选择 | 第92-99页 |
一、属性子集选择方法的两个组成部分 | 第92-94页 |
二、属性子集选择方法的两种模式 | 第94-95页 |
三、基于各学科知识的属性子集选择方法 | 第95-97页 |
四、关于模式识别中基于距离的评价函数的思考 | 第97-99页 |
第三节 逐步向前无监督属性子集的选择方法 | 第99-107页 |
一、逐步选择方法的不足 | 第99-100页 |
二、逐步向前无监督属性子集选择方法的思路 | 第100-101页 |
三、逐步向前无监督属性子集选择方法的基本框架 | 第101页 |
四、统计模拟及方法验证 | 第101-105页 |
五、逐步向前无监督属性子集选择方法的合理性和局限性 | 第105-107页 |
第六章 全文的总结 | 第107-109页 |
第一节 全文的主要工作 | 第107页 |
第二节 尚需研究的问题 | 第107-109页 |
参考文献 | 第109-115页 |
致谢 | 第115-116页 |
攻读博士学位期间发表或录用的论文 | 第116页 |