基于LDA的微博与传统媒体的话题对比研究
| 摘要 | 第1-4页 |
| ABSTRACT | 第4-7页 |
| 第一章 绪论 | 第7-10页 |
| ·研究背景及意义 | 第7-8页 |
| ·研究目的 | 第8页 |
| ·研究内容 | 第8-9页 |
| ·本章小结 | 第9-10页 |
| 第二章 相关研究介绍 | 第10-22页 |
| ·微博与新闻报道研究概述 | 第10页 |
| ·基于话题模型的话题发现 | 第10-15页 |
| ·常用的话题模型 | 第10-13页 |
| ·微博上常用的话题模型 | 第13-15页 |
| ·新闻报道与微博话题对比研究 | 第15-21页 |
| ·新闻报道上的话题研究 | 第15-17页 |
| ·微博上的话题研究 | 第17-20页 |
| ·微博与新闻报道上话题的对比研究 | 第20-21页 |
| ·本章小结 | 第21-22页 |
| 第三章 基于 LDA 的话题发现与相同话题的识别 | 第22-28页 |
| ·本文的符号 | 第22页 |
| ·话题的发现 | 第22-24页 |
| ·话题的定义 | 第22-23页 |
| ·话题的生成 | 第23-24页 |
| ·话题的分类 | 第24页 |
| ·相同话题的识别 | 第24-27页 |
| ·同一种媒体上相邻时间段内相同话题的识别 | 第25页 |
| ·不同媒体同一时间段上相同话题的识别 | 第25-27页 |
| ·本章小结 | 第27-28页 |
| 第四章 微博与新闻报道对比研究 | 第28-34页 |
| ·关注度指标 | 第28-29页 |
| ·演化度指标 | 第29-30页 |
| ·非相邻时间段上两个话题的距离 | 第29-30页 |
| ·演化度指标 | 第30页 |
| ·差异度指标 | 第30-33页 |
| ·话题在不同词表上的平滑 | 第31-32页 |
| ·话题分布的距离 | 第32页 |
| ·差异度指标 | 第32-33页 |
| ·系统实现 | 第33页 |
| ·本章小结 | 第33-34页 |
| 第五章 实验结果与分析 | 第34-62页 |
| ·实验语料与参数设置 | 第34-36页 |
| ·语料搜集 | 第34页 |
| ·文本预处理 | 第34-35页 |
| ·中文分词 | 第35页 |
| ·参数设置 | 第35-36页 |
| ·话题发现(LDA)的实验 | 第36-40页 |
| ·关注度指标的实验 | 第40-44页 |
| ·演化度指标的实验及趋势分析 | 第44-52页 |
| ·相同话题识别的实验 | 第52-54页 |
| ·差异度指标的实验 | 第54-59页 |
| ·本章小结 | 第59-62页 |
| 第六章 总结与展望 | 第62-64页 |
| ·本文的总结 | 第62-63页 |
| ·本文的主要工作 | 第62页 |
| ·本文的主要贡献 | 第62-63页 |
| ·未来的展望 | 第63-64页 |
| 参考文献 | 第64-66页 |
| 致谢 | 第66-67页 |
| 攻读硕士学位期间已发表或录用的论文 | 第67-69页 |