中文微博的热点话题检测及趋势预测算法研究
| 摘要 | 第4-5页 |
| ABSTRACT | 第5页 |
| 第1章 绪论 | 第8-16页 |
| 1.1 研究背景与意义 | 第8-12页 |
| 1.1.1 研究背景 | 第8-10页 |
| 1.1.2 研究意义 | 第10-12页 |
| 1.2 国内外研究现状 | 第12-14页 |
| 1.3 论文主要工作及创新 | 第14-15页 |
| 1.4 论文的组织结构 | 第15-16页 |
| 第2章 课题相关理论 | 第16-24页 |
| 2.1 文本表示模型 | 第16-17页 |
| 2.2 文本特征选择与权重计算 | 第17-19页 |
| 2.2.1 常用特征选择法 | 第17-18页 |
| 2.2.2 常用权重计算法 | 第18-19页 |
| 2.3 潜在狄利克雷模型 | 第19-20页 |
| 2.4 隐马尔可夫模型 | 第20-23页 |
| 2.4.1 前向算法 | 第22页 |
| 2.4.2 后向算法 | 第22-23页 |
| 2.4.3 前向后向算法 | 第23页 |
| 2.5 本章小结 | 第23-24页 |
| 第3章 热点话题检测与趋势预测算法 | 第24-38页 |
| 3.1 热点话题定义 | 第24-25页 |
| 3.2 热点话题检测与预测算法框架 | 第25-26页 |
| 3.3 基于内容的热点话题检测算法 | 第26-34页 |
| 3.3.1 数据预处理 | 第26-28页 |
| 3.3.2 话题抽取与去噪 | 第28-29页 |
| 3.3.3 基于传播特征的微博热度计算 | 第29-31页 |
| 3.3.4 基于词频的话题热度计算校正 | 第31-32页 |
| 3.3.5 检测模型评估方法 | 第32-34页 |
| 3.4 热点话题趋势预测 | 第34-37页 |
| 3.4.1 话题热度状态识别 | 第34-35页 |
| 3.4.2 基于内容参与状态的隐马尔科夫模型 | 第35-36页 |
| 3.4.3 预测算法评估方法 | 第36-37页 |
| 3.5 本章小结 | 第37-38页 |
| 第4章 实验与分析 | 第38-50页 |
| 4.1 数据集 | 第38-39页 |
| 4.2 基于内容的热点话题检测算法实验与评估 | 第39-44页 |
| 4.2.1 实验过程 | 第39-40页 |
| 4.2.2 实验评估 | 第40-44页 |
| 4.3 话题趋势预测算法实验与评估 | 第44-49页 |
| 4.3.1 实验过程 | 第44-45页 |
| 4.3.2 实验评估 | 第45-49页 |
| 4.4 本章小结 | 第49-50页 |
| 第5章 总结与展望 | 第50-52页 |
| 5.1 总结 | 第50-51页 |
| 5.2 展望 | 第51-52页 |
| 参考文献 | 第52-56页 |
| 发表论文和参加科研情况说明 | 第56-58页 |
| 致谢 | 第58-59页 |