海量数据约简与分类研究

独创性声明	第1页
关于论文使用授权的说明	第4-5页
摘要	第5-7页
ABSTRACT	第7-12页
1 KDD 中的机器学习	第12-33页
·机器学习的发展	第12-14页
·数据库中的机器发现	第14-15页
·分类	第15-22页
·贝叶斯分类	第15-16页
·分治法	第16-17页
·覆盖算法	第17-18页
·投票算法	第18-20页
·Bagging 算法	第19页
·Boosting 算法	第19-20页
·偏置与归纳	第20-22页
·聚类	第22-24页
·统计学习理论	第24-30页
·机器学习的本质	第24-26页
·函数集的学习性能与VC 维	第26-27页
·推广性的界	第27页
·支持向量机	第27-29页
·基于邻域的空间划分方法	第29-30页
·数据约简	第30-32页
·本文的组织	第32-33页
2 基于格的学习与约简	第33-75页
·格的基础理论	第33-35页
·超元组和域格	第35-40页
·相关工作	第36-39页
·保存分类结构的元组合并	第39-40页
·数据约简与版本空间搜索	第40-42页
·密度最大的合并超元组	第42-46页
·基于格的高效渐增式数据约简	第46-59页
·超元组的调整	第51-53页
·渐增式约简算法	第53-55页
·算法分析	第55-59页
·典型实例的选择与约简数据的生成	第59-62页
·利用超元组的近邻分类	第62-63页
·试验结果	第63-73页
·试验1——分类精度	第63-64页
·试验2——参数选取与收敛性能	第64-70页
·试验3——大规模数据下的性能	第70页
·试验4——聚类	第70-73页
·讨论	第73-75页
3 高维数据中高效的相似性计算方法	第75-86页
·简介	第75页
·定义	第75-78页
·算法	第78-82页
·基于部分特征的k-NN 算法	第78-79页
·基于投影的k-NN 算法	第79-82页
·实验及结果	第82-85页
·小结	第85-86页
4 决策树的画法及可视化	第86-95页
·概述	第86-87页
·定义及算子	第87-90页
·树的画法	第90-91页
·算法讨论	第91-93页
·树的可视化要点	第93-94页
·小结	第94-95页
5 超范例与专家知识的融合	第95-109页
·问题的提出与背景	第95-98页
·问题分析与范例表示	第98-99页
·相似性度量	第99-100页
·索引与检索	第100-102页
·基于框架的修正	第102-106页
·知识表示与框架系统	第102-103页
·框架模型的设计	第103-104页
·框架模型的实施技术	第104-106页
·小结	第106-109页
6 多策略通用数据采掘平台MSMiner	第109-123页
·引言	第109页
·海量数据的采掘平台需要具备什么	第109-111页
·数据仓库	第111-113页
·数据仓库建模及OLAP 的实现	第112-113页
·数据抽取及更新	第113页
·数据采掘集成工具	第113-118页
·面向对象的数据采掘任务模型	第114-115页
·面向对象任务模型处理机制	第115-116页
·数据采掘语言DML	第116页
·可扩展的算法库	第116-117页
·数据采掘任务向导	第117页
·数据采掘结果的解释和评价	第117-118页
·元数据	第118-119页
·应用举例	第119页
·小结	第119-123页
7 结束语	第123-126页
·本文主要贡献与创新	第123-124页
·下一步的研究工作	第124-126页
参考文献	第126-135页
作者简历	第135-137页
致谢	第137页