首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

数据挖掘中分类算法的研究

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-15页
    1.1 论文研究背景第9-10页
    1.2 论文研究意义第10页
    1.3 国内外研究现状第10-12页
        1.3.1 对“标记瓶颈”问题的研究第10-12页
        1.3.2 对分布式计算平台的研究第12页
    1.4 本文创新点及主要贡献第12-13页
        1.4.1 本文创新点第12-13页
        1.4.2 本文主要贡献第13页
    1.5 论文组织结构第13-15页
第二章 数据挖掘中分类问题概述第15-23页
    2.1 数据挖掘概述第15-16页
    2.2 数据挖掘中的分类问题第16-19页
        2.2.1 分类问题概述第16-17页
        2.2.2 数据挖掘中常用分类算法第17-19页
    2.3 半监督分类方法第19-21页
        2.3.1 半监督学习概述第19-20页
        2.3.2 协同训练算法第20-21页
    2.4 WEKA概述第21-22页
    2.5 本章小结第22-23页
第三章 分布式计算平台Hadoop第23-27页
    3.1 Hadoop概述第23页
    3.2 分布式文件系统HDFS第23-24页
    3.3 并行计算模型MapReduce第24-25页
    3.4 Hadoop的IO第25页
    3.5 MapReduce作业的执行流程第25-26页
    3.6 本章小结第26-27页
第四章 基于半监督分类算法的研究第27-35页
    4.1 Co-training by Committee算法分析第27-29页
        4.1.1 Co-training by Committee算法描述第27-29页
        4.1.2 Co-training by Committee算法的不足第29页
    4.2 基于Co-training by Committee算法的性能提升研究第29-33页
        4.2.1 利用多个分类器标记无标记样本的策略第30页
        4.2.2 基于Data Editing计算标记置信度第30-31页
        4.2.3 改进的Co-training by Committee算法第31-33页
    4.3 本章小结第33-35页
第五章 基于Hadoop平台的算法并行化部署第35-47页
    5.1 改进的Co-training by Committee算法的并行化方案第35-38页
        5.1.1 训练分类器的并行化方案第35-37页
        5.1.2 标记测试样本的并行化方案第37-38页
    5.2 两种并行化方案的MapReduce实现第38-40页
        5.2.1 训练分类器的MapReduce实现第38-39页
        5.2.2 标记测试样本的MapReduce实现第39-40页
    5.3 改进的Co-training by Committee算法在Hadoop平台实现的模块设计第40-46页
    5.4 本章小结第46-47页
第六章 仿真验证第47-66页
    6.1 改进的Co-training by Committee算法的性能验证第47-56页
        6.1.1 仿真实验设置第47-48页
        6.1.2 仿真结果第48-56页
    6.2 改进算法在Hadoop平台上的仿真结果第56-62页
        6.2.1 仿真实验设置第57-60页
        6.2.2 实验结果与分析第60-62页
    6.3 改进算法在网络流量分类中的应用第62-64页
        6.3.1 网络流量分类意义第62页
        6.3.2 网络流量数据集介绍第62-63页
        6.3.3 网络流量分类第63-64页
    6.4 本章小结第64-66页
第七章 结束语第66-68页
    7.1 工作总结第66-67页
    7.2 未来展望第67-68页
参考文献第68-71页
致谢第71-72页
攻读学位期间发表的学术论文目录第72页

论文共72页,点击 下载论文
上一篇:医院门诊信息实时采集与智能处理系统的设计与实现
下一篇:基于网络数据的汽车用户行为和倾向性研究