摘要 | 第1-4页 |
Abstract | 第4-10页 |
第1章 绪论 | 第10-21页 |
·数据挖掘概述 | 第10-11页 |
·数据挖掘技术的产生背景 | 第11-12页 |
·数据挖掘技术的商业需求分析 | 第11页 |
·数据挖掘产生的技术背景分析 | 第11-12页 |
·数据挖掘过程的主要步骤 | 第12-13页 |
·数据挖掘的任务和方法 | 第13-16页 |
·数据抽取 | 第14页 |
·分类和预测 | 第14页 |
·聚类 | 第14-15页 |
·关联规则发现 | 第15-16页 |
·数据挖掘对象 | 第16页 |
·贝叶斯分类方法 | 第16页 |
·蒙特卡罗方法 | 第16-17页 |
·数据挖掘工具的评价 | 第17-19页 |
·本文的主要工作 | 第19-20页 |
·论文的组织 | 第20-21页 |
第2章 分类和预测 | 第21-39页 |
·分类和预测概述 | 第21-22页 |
·判定树归纳分类 | 第22-26页 |
·判定树的概念 | 第22-24页 |
·典型判定树算法描述 | 第24页 |
·判定树学习的特点 | 第24-25页 |
·判定树的构造 | 第25页 |
·由判定树提取分类规则 | 第25-26页 |
·贝叶斯分类 | 第26-29页 |
·贝叶斯分类的数学基础 | 第26页 |
·朴素贝叶斯分类 | 第26-27页 |
·贝叶斯信念网络 | 第27-29页 |
·后向传播分类 | 第29-31页 |
·多层前馈神经网络 | 第29-30页 |
·后向传播 | 第30-31页 |
·后向传播和可解释性 | 第31页 |
·其他分类方法 | 第31-36页 |
·基于源自关联规则挖掘概念的分类 | 第31-32页 |
·k-最临近分类 | 第32页 |
·基于案例的推理 | 第32-34页 |
·遗传算法 | 第34-35页 |
·粗糙集方法 | 第35页 |
·模糊集方法 | 第35-36页 |
·预测 | 第36-37页 |
·线性回归和多元回归 | 第36页 |
·非线性回归 | 第36-37页 |
·其他回归模型 | 第37页 |
·分类法的准确性 | 第37-39页 |
·评估分类法的准确率 | 第37页 |
·提高分类法的准确率 | 第37-38页 |
·准确率能否足够判定分类法的问题 | 第38-39页 |
第3章 贝叶斯分类 | 第39-64页 |
·数学与统计学基础知识 | 第39-45页 |
·随机事件 | 第39-40页 |
·事件的关系及运算 | 第40-41页 |
·随机事件的概率 | 第41-42页 |
·概率加法定理 | 第42页 |
·条件概率和概率的乘法 | 第42页 |
·全概率公式与贝叶斯公式 | 第42-43页 |
·事件的独立性 | 第43页 |
·随机变量及其分布函数 | 第43页 |
·二维随机变量 | 第43-44页 |
·随机变量的数字特征 | 第44-45页 |
·朴素贝叶斯分类 | 第45-49页 |
·朴素贝叶斯分类的原理 | 第45-47页 |
·朴素贝叶斯分类的计算 | 第47-48页 |
·效率分析及小结 | 第48-49页 |
·贝叶斯信念网络 | 第49-52页 |
·贝叶斯信念网络概述 | 第49-50页 |
·训练贝叶斯信念网络 | 第50-52页 |
·贝叶斯信念网络的学习算法 | 第52-56页 |
·LBR(Lazy Bayesian Rules) | 第52-54页 |
·TAN(Tree-Augmented Naive Bayes) | 第54-56页 |
·推进(Boosting) | 第56-57页 |
·由数据构造贝叶斯信念网络 | 第57-64页 |
·基于信息理论的方法 | 第58-59页 |
·信念网络构造算法 | 第59-62页 |
·复杂度分析 | 第62-64页 |
第4章 蒙特卡罗方法 | 第64-82页 |
·蒙特卡罗方法概述 | 第64-67页 |
·蒙特卡罗方法的基本原理及思想 | 第64-65页 |
·蒙特卡罗求解的三个主要步骤 | 第65页 |
·蒙特卡罗求解积分示例 | 第65-67页 |
·蒙特卡罗方法的主要优点 | 第67页 |
·样本及其分布 | 第67-72页 |
·总体和样本 | 第67-68页 |
·样本统计量及其数字特征 | 第68-69页 |
·随机变量的函数的数学期望 | 第69页 |
·参数估计 | 第69-72页 |
·蒙特卡罗贝叶斯分类 | 第72-77页 |
·含有参数形式的贝叶斯定理 | 第72-73页 |
·贝叶斯方法 | 第73-74页 |
·似然原理 | 第74-75页 |
·蒙特卡罗积分 | 第75-76页 |
·重要性抽样 | 第76-77页 |
·马尔可夫链蒙特卡罗方法 | 第77-82页 |
·马尔可夫链 | 第77-78页 |
·马尔可夫链蒙特卡罗概述 | 第78-79页 |
·Metropolis Hastings抽样 | 第79-80页 |
·Gibbs抽样 | 第80-82页 |
第5章 蒙特卡罗贝叶斯分类的改进 | 第82-90页 |
·巨型数据集挖掘的实际问题 | 第82-84页 |
·对巨型数据集分析的意义 | 第82页 |
·对巨型数据集分析的困难 | 第82-83页 |
·改进方案 | 第83-84页 |
·用于巨型数据集分析的重要性抽样 | 第84-86页 |
·对数据集的抽样划分 | 第84-85页 |
·改进的算法描述过程 | 第85-86页 |
·效率和有效样本容量 | 第86-87页 |
·效率分析 | 第86页 |
·有效样本容量 | 第86-87页 |
·巨型数据集的极小量过滤 | 第87-89页 |
·计算效率比较及小结 | 第89-90页 |
·计算效率比较 | 第89页 |
·小结 | 第89-90页 |
第6章 总结和展望 | 第90-92页 |
参考文献 | 第92-102页 |
作者研究生期间发表论文 | 第102-103页 |
致谢 | 第103页 |