首页--文化、科学、教育、体育论文--科学、科学研究论文--科学研究理论论文--知识学论文

基于分类模型的知识发现过程研究

中文摘要第1-10页
英文摘要第10-12页
缩略词和符号说明第12-13页
插图和附表索引第13-15页
第一章 绪论第15-35页
 §1.1 知识发现的研究背景及定义第15-18页
  1.1.1 知识发现的研究背景第15-16页
  1.1.2 知识发现的定义第16-18页
 §1.2 知识发现的处理过程第18-24页
  1.2.1 Fayyad给出的知识发现过程模型第18-20页
  1.2.2 其它的知识发现过程模型第20-21页
  1.2.3 基于数据抽取器的知识发现处理模型第21-24页
 §1.3 知识发现过程的研究现状与发展趋势第24-31页
  1.3.1 知识发现过程的研究概况第24-27页
  1.3.2 知识发现与相关学科的区别与联系第27页
  1.3.3 知识发现过程的应用与发展第27-30页
  1.3.4 知识发现过程研究所面临的挑战第30-31页
 §1.4 本论文研究的主要内容和意义第31-35页
第二章 分类算法及评价方法第35-56页
 §2.1 分类的定义第35-36页
 §2.2 决策树第36-45页
  2.2.1 决策树构造算法第36-38页
   2.2.1.1 决策树的基本概念第36-37页
   2.2.1.2 决策树的构造算法第37-38页
  2.2.2 分枝准则第38-40页
  2.2.3 剪枝策略第40-43页
  2.2.4 缺值问题第43-44页
  2.2.5 决策树的特性第44-45页
 §2.3 判别函数第45-49页
  2.3.1 简单贝叶斯分类器第46-47页
  2.3.2 线性判别分类器第47-49页
 §2.4 近邻法第49-50页
 §2.5 分类方法的评价方法第50-54页
  2.5.1 分类数据挖掘算法的评价指标第51-53页
   2.5.1.1 错误率第51-53页
   2.5.1.2 其它指标第53页
  2.5.2 几种基本分类算法的精度比较第53-54页
 §2.6 本章小结第54-56页
第三章 数据预处理——属性选择第56-75页
 §3.1 引言第56-60页
  3.1.1 属性选择的定义第58-59页
  3.1.2 属性的相关性第59-60页
 §3.2 属性选择方法第60-66页
  3.2.1 属性选择的一般程序第60-62页
  3.2.2 过滤方法第62-64页
  3.2.3 打包方法第64页
  3.2.4 两者结合的属性选择方法第64-66页
 §3.3 MBFS算法第66-71页
  3.3.1 算法的理论基础第66-69页
   3.3.1.1 交叉熵的定义第66-67页
   3.3.1.2 Markov Blanket准则第67-69页
  3.3.2 MBFS算法第69-71页
 §3.4 实验验证与结果第71-73页
 §3.5 本章小结第73-75页
第四章 数据抽取——SQL数据抽取器第75-92页
 §4.1 引言第75-76页
 §4.2 数据挖掘算法与数据库管理系统接口设计第76-79页
 §4.3 数据抽取器的设计第79-82页
 §4.4 SQL-C4.5决策树数据挖掘算法第82-88页
  4.4.1 C4.5决策树算法第83页
  4.4.2 choosebest()函数第83-85页
  4.4.3 stopping criterion()函数第85-86页
  4.4.4 postprune()函数第86页
  4.4.5 SQL_C4.5决策树算法第86-88页
 §4.5 SQL-简单贝叶斯抽取器第88-90页
 §4.6 通用的基于抽取器的决策树数据挖掘算法第90页
 §4.7 本章小结第90-92页
第五章 数据挖掘——多变量决策树第92-107页
 §5.1 多变量决策树的生成方法第92-97页
  5.1.1 多变量决策树第92-93页
  5.1.2 局部最优方法第93-95页
  5.1.3 构造属性法第95-96页
  5.1.4 斜树算法第96-97页
 §5.2 LICT算法第97-102页
 §5.3 实验结果和分析第102-105页
  5.3.1 实验方法和结果分析第102-104页
  5.3.2 错误率的Bias-Variance分析第104-105页
  5.3.3 学习时间比较第105页
 §5.4 本章小结第105-107页
第六章 数据挖掘——组合近邻分类器第107-124页
 §6.1 组合模型第107-111页
  6.1.1 组合分类器方法第107-108页
  6.1.2 Bagging法第108-109页
  6.1.3 Boosting方法第109-111页
  6.1.4 错误校正输出代码第111页
 §6.2 混合系统第111-113页
 §6.3 近邻分类器第113-114页
 §6.4 组合近邻分类算法MNN第114-118页
  6.4.1 MNN算法第115-117页
  6.4.2 参数的选择第117-118页
 §6.5 实验方法和结果分析第118-123页
  6.5.1 实验方法第118页
  6.5.2 精度第118-119页
  6.5.3 计算复杂度第119-120页
  6.5.4 不相关属性的健壮性第120-121页
  6.5.5 错误率的Bias-Variance分析第121-123页
 §6.6 本章小结第123-124页
第七章 知识发现过程应用——一个原型系统设计第124-134页
 §7.1 KDD原型系统设计第124-127页
  7.1.1 MKDS系统配置第124-125页
  7.1.2 客户端交互控制系统第125-126页
  7.1.3 广义模型服务器第126页
  7.1.4 客户服务器结构第126-127页
 §7.2 MKDS系统知识发现过程第127-129页
 §7.3 运行过程与结果分析第129-133页
 §7.4 本章小结第133-134页
第八章 结论与展望第134-138页
 §8.1 研究结论第134-135页
 §8.2 研究展望第135-138页
致谢第138-139页
作者在攻读博士学位期间发表的论文第139-140页
参考文献第140-150页
附录A 实验数据第150-151页
附录B Markov Blanket性质证明第151页

论文共151页,点击 下载论文
上一篇:Gamma算子线性组合的加权同时逼近
下一篇:关于柯克曼三元系的大集