基于R语言的网络新闻的流行度预测研究
摘要 | 第5-6页 |
ABSTRACT | 第6页 |
1 绪论 | 第9-14页 |
1.1 研究背景与意义 | 第9-10页 |
1.2 网络新闻国内研究现状 | 第10-11页 |
1.3 网络新闻国外研究现状 | 第11页 |
1.4 研究方法 | 第11-14页 |
1.4.1 取材 | 第11-13页 |
1.4.2 使用工具 | 第13-14页 |
2 理论基础 | 第14-29页 |
2.1 特征选择 | 第14-19页 |
2.2 几种高级算法介绍 | 第19-25页 |
2.2.1 AdaBoost算法 | 第19-20页 |
2.2.2 随机森林算法 | 第20-23页 |
2.2.3 支持向量机算法 | 第23-25页 |
2.3 模型评估与选择 | 第25-29页 |
3 实例分析 | 第29-50页 |
3.1 数据预处理 | 第29-33页 |
3.1.1 数据集加载 | 第29-30页 |
3.1.2 数据清理 | 第30-32页 |
3.1.3 数据变换 | 第32页 |
3.1.4 冗余分析 | 第32-33页 |
3.2 特征选择 | 第33-34页 |
3.3 建立模型 | 第34-43页 |
3.3.1 数据探究分析 | 第34-36页 |
3.3.2 自适应增强算法分析 | 第36-38页 |
3.3.3 随机森林算法分析 | 第38-42页 |
3.3.4 支持向量机算法分析 | 第42-43页 |
3.4 模型评估 | 第43-50页 |
3.4.1 不同模型之间的混淆矩阵对比情况 | 第43-45页 |
3.4.2 不同模型之间的风险图分析 | 第45-48页 |
3.4.3 不同模型之间的ROC图及相关图表 | 第48-50页 |
4 总结与展望 | 第50-52页 |
4.1 总结 | 第50页 |
4.2 展望 | 第50-52页 |
参考文献 | 第52-55页 |
致谢 | 第55页 |