首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

海量数据约简与分类研究

独创性声明第1页
关于论文使用授权的说明第4-5页
摘 要第5-7页
ABSTRACT第7-12页
1 KDD 中的机器学习第12-33页
   ·机器学习的发展第12-14页
   ·数据库中的机器发现第14-15页
   ·分类第15-22页
     ·贝叶斯分类第15-16页
     ·分治法第16-17页
     ·覆盖算法第17-18页
     ·投票算法第18-20页
       ·Bagging 算法第19页
       ·Boosting 算法第19-20页
     ·偏置与归纳第20-22页
   ·聚类第22-24页
   ·统计学习理论第24-30页
     ·机器学习的本质第24-26页
     ·函数集的学习性能与VC 维第26-27页
     ·推广性的界第27页
     ·支持向量机第27-29页
     ·基于邻域的空间划分方法第29-30页
   ·数据约简第30-32页
   ·本文的组织第32-33页
2 基于格的学习与约简第33-75页
   ·格的基础理论第33-35页
   ·超元组和域格第35-40页
     ·相关工作第36-39页
     ·保存分类结构的元组合并第39-40页
   ·数据约简与版本空间搜索第40-42页
   ·密度最大的合并超元组第42-46页
   ·基于格的高效渐增式数据约简第46-59页
     ·超元组的调整第51-53页
     ·渐增式约简算法第53-55页
     ·算法分析第55-59页
   ·典型实例的选择与约简数据的生成第59-62页
   ·利用超元组的近邻分类第62-63页
   ·试验结果第63-73页
     ·试验1——分类精度第63-64页
     ·试验2——参数选取与收敛性能第64-70页
     ·试验3——大规模数据下的性能第70页
     ·试验4——聚类第70-73页
   ·讨论第73-75页
3 高维数据中高效的相似性计算方法第75-86页
   ·简介第75页
   ·定义第75-78页
   ·算法第78-82页
     ·基于部分特征的k-NN 算法第78-79页
     ·基于投影的k-NN 算法第79-82页
   ·实验及结果第82-85页
   ·小结第85-86页
4 决策树的画法及可视化第86-95页
   ·概述第86-87页
   ·定义及算子第87-90页
   ·树的画法第90-91页
   ·算法讨论第91-93页
   ·树的可视化要点第93-94页
   ·小结第94-95页
5 超范例与专家知识的融合第95-109页
   ·问题的提出与背景第95-98页
   ·问题分析与范例表示第98-99页
   ·相似性度量第99-100页
   ·索引与检索第100-102页
   ·基于框架的修正第102-106页
     ·知识表示与框架系统第102-103页
     ·框架模型的设计第103-104页
     ·框架模型的实施技术第104-106页
   ·小结第106-109页
6 多策略通用数据采掘平台MSMiner第109-123页
   ·引言第109页
   ·海量数据的采掘平台需要具备什么第109-111页
   ·数据仓库第111-113页
     ·数据仓库建模及OLAP 的实现第112-113页
     ·数据抽取及更新第113页
   ·数据采掘集成工具第113-118页
     ·面向对象的数据采掘任务模型第114-115页
     ·面向对象任务模型处理机制第115-116页
     ·数据采掘语言DML第116页
     ·可扩展的算法库第116-117页
     ·数据采掘任务向导第117页
     ·数据采掘结果的解释和评价第117-118页
   ·元数据第118-119页
   ·应用举例第119页
   ·小结第119-123页
7 结束语第123-126页
   ·本文主要贡献与创新第123-124页
   ·下一步的研究工作第124-126页
参考文献第126-135页
作者简历第135-137页
致谢第137页

论文共137页,点击 下载论文
上一篇:IPv6协议一致性测试研究及测试系统实现
下一篇:基于笔输入的数学公式编辑器