基于深度学习的新闻评论热度预测研究
| 摘要 | 第4-5页 |
| Abstract | 第5页 |
| 第1章 绪论 | 第8-18页 |
| 1.1 研究背景和意义 | 第8-10页 |
| 1.2 国内外研究现状 | 第10-16页 |
| 1.2.1 有用性预测研究现状 | 第10-14页 |
| 1.2.2 新闻热度预测研究现状 | 第14-16页 |
| 1.3 任务的难点和本文研究思路 | 第16-17页 |
| 1.4 本文内容安排及结构安排 | 第17-18页 |
| 第2章 数据采集与特征工程 | 第18-32页 |
| 2.1 引言 | 第18页 |
| 2.2 数据采集 | 第18-21页 |
| 2.2.1 今日头条新闻数据采集 | 第18-20页 |
| 2.2.2 网易新闻数据采集 | 第20-21页 |
| 2.3 实验评价指标 | 第21-24页 |
| 2.4 特征工程 | 第24-30页 |
| 2.4.1 文本特征(TextFeature) | 第24-26页 |
| 2.4.2 情感特征(Sentiment) | 第26-28页 |
| 2.4.3 主题分布特征(Topic) | 第28-29页 |
| 2.4.4 时间(Time) | 第29-30页 |
| 2.4.5 新闻热度(NewsHot) | 第30页 |
| 2.5 本章小结 | 第30-32页 |
| 第3章 基于深度学习模型的新闻评论热度预测 | 第32-50页 |
| 3.1 引言 | 第32页 |
| 3.2 传统方法模型介绍 | 第32-35页 |
| 3.2.1 支持向量机(SVM) | 第32-33页 |
| 3.2.2 随机森林(RandomForest) | 第33-34页 |
| 3.2.3 XGBoost | 第34-35页 |
| 3.3 实验设置与结果分析 | 第35-40页 |
| 3.3.1 特征组合与分类器选择实验 | 第36-39页 |
| 3.3.2 实验结果分析 | 第39-40页 |
| 3.4 深度学习相关技术介绍 | 第40-44页 |
| 3.4.1 词向量 | 第40-43页 |
| 3.4.2 卷积神经网络 | 第43-44页 |
| 3.5 基于深度学习模型的新闻评论热度预测 | 第44-49页 |
| 3.5.1 词向量 | 第45页 |
| 3.5.2 未登录词处理 | 第45页 |
| 3.5.3 基于CNN的模型构建 | 第45-48页 |
| 3.5.4 实验结果分析 | 第48-49页 |
| 3.6 本章小结 | 第49-50页 |
| 第4章 新闻评论热度预测系统的设计与实现 | 第50-61页 |
| 4.1 引言 | 第50页 |
| 4.2 系统总体设计与模块化框架 | 第50-52页 |
| 4.2.1 相关技术简介 | 第50页 |
| 4.2.2 系统功能设计 | 第50-51页 |
| 4.2.3 系统模块设计 | 第51-52页 |
| 4.3 系统模块详细设计 | 第52-58页 |
| 4.3.1 爬虫模块 | 第52-56页 |
| 4.3.2 语料库构建模块 | 第56-58页 |
| 4.3.3 新闻评论热度预测模块 | 第58页 |
| 4.4 系统功能展示 | 第58-60页 |
| 4.5 本章小结 | 第60-61页 |
| 结论 | 第61-63页 |
| 参考文献 | 第63-68页 |
| 致谢 | 第68页 |