首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于XGBOOST和随机森林的热门微博预测研究

摘要第4-5页
ABSTRACT第5页
第1章 绪论第8-14页
    1.1 研究背景和意义第8-10页
    1.2 研究现状第10-11页
    1.3 论文主要工作及创新第11-12页
    1.4 论文组织结构第12-14页
第2章 相关理论研究第14-22页
    2.1 文本的主题特征提取第14-15页
    2.2 连续特征离散化技术第15-16页
    2.3 XGBOOST第16-18页
    2.4 随机森林第18-22页
第3章 基于XGBOOST的特征离散化算法第22-36页
    3.1 算法框架设计第22-24页
    3.2 微博预处理及特征提取第24-28页
        3.2.1 数据预处理第24页
        3.2.2 文本分词第24-25页
        3.2.3 文本主题特征的提取第25-27页
        3.2.4 微博用户特征提取第27-28页
    3.3 基于XGBOOST的特征离散化第28-31页
    3.4 实验及分析第31-36页
        3.4.1 实验数据集第31页
        3.4.2 实验过程描述第31-32页
        3.4.3 实验结果及分析第32-36页
第4章 基于约束的随机森林热门微博预测算法第36-48页
    4.1 特征间相关性分析第36-39页
        4.1.1 使用卡方检验分析特征间相关性第36-37页
        4.1.2 使用皮尔逊系数分析特征间相关性第37-39页
    4.2 基于约束的随机森林分类算法第39-42页
        4.2.1 传统随机森林算法的特征选择第39-41页
        4.2.2 基于约束的随机森林特征选择第41-42页
    4.3 实验及分析第42-46页
        4.3.1 实验环境第42-43页
        4.3.2 数据说明第43页
        4.3.3 实验过程描述第43页
        4.3.4 实验结果及分析第43-46页
    4.4 基于CRF的热门微博预测算法总结第46-48页
第5章 总结与展望第48-50页
    5.1 总结第48页
    5.2 展望第48-50页
参考文献第50-54页
发表论文和参加科研情况说明第54-55页
致谢第55-56页

论文共56页,点击 下载论文
上一篇:面向网络新闻的热点话题发现与极性分析
下一篇:城市地下管线档案动态更新管理系统的开发和应用