首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于游客属性信息的消费因素数据挖掘

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-13页
    1.1 研究背景和意义第10页
    1.2 国内外研究现状第10-11页
    1.3 主要研究内容第11-12页
    1.4 本文组织结构第12-13页
第二章 相关技术介绍第13-27页
    2.1 决策树第13-19页
        2.1.1 算法简介第13页
        2.1.2 决策树方法第13-19页
            2.1.2.1 ID3算法第13-16页
            2.1.2.2 C4.5 算法第16-17页
            2.1.2.3 CART算法第17-19页
    2.2 模型组合方法第19-21页
        2.2.1 模型组合概念第19-21页
    2.3 随机森林第21-24页
        2.3.1 随机采样第22-24页
        2.3.2 随机森林的随机性分析第24页
    2.4 随机森林数学理论第24-26页
        2.4.1 相关概念第24-26页
        2.4.2 随机森林的收敛性第26页
        2.4.3 泛化误差第26页
    2.5 本章小结第26-27页
第三章 随机森林在游客消费影响因素分析中的应用第27-47页
    3.1 数据的采集第27页
    3.2 数据的预处理第27-38页
        3.2.1 处理缺失的属性值第28-29页
        3.2.2 处理冗余数据第29页
        3.2.3 数据转换第29-31页
        3.2.4 删除样本中的异常样本第31-32页
        3.2.5 对不平衡数据的处理方法第32-38页
    3.3 随机森林模型参数的选择第38-40页
        3.3.1 mtry值的设定第38-39页
        3.3.2 ntree值的设定第39-40页
    3.4 建立初步的分类模型第40-46页
        3.4.1 模型性能分析第40页
        3.4.2 游客消费影响因素分析第40-46页
    3.5 本章小结第46-47页
第四章 改进的随机森林算法第47-72页
    4.1 影响模型性能的因素分析第48-53页
        4.1.1 构建决策树的属性个数第48-50页
        4.1.2 模型中决策树的个数第50-51页
        4.1.3 构建模型的两个随机性第51-53页
    4.2 改进算法基本思想第53页
    4.3 属性度量方法第53-55页
        4.3.1 卡方检验第53-54页
        4.3.2 互信息第54-55页
    4.4 改进的特征选择算法第55-56页
    4.5 算法相关接口与部分代码第56-60页
    4.6 实验与分析第60-71页
        4.6.1 特征空间的划分第60页
        4.6.2 算法参数的选取第60-64页
        4.6.3 改进算法与原始算法的分类性能比较第64-66页
        4.6.4 改进模型的稳定性研究第66-68页
        4.6.5 模型的强度与相关度研究第68-71页
        4.6.6 改进算法的复杂度分析第71页
    4.7 本章小结第71-72页
第五章 总结与展望第72-73页
    5.1 本文工作总结第72页
    5.2 未来展望第72-73页
致谢第73-74页
参考文献第74-77页
攻读硕士学位期间取得的成果第77-78页

论文共78页,点击 下载论文
上一篇:3D视觉注意模型及其在运动目标分割中的应用研究
下一篇:基于“谱”反演的红外图像增强与重建方法研究