摘要 | 第5-6页 |
Abstract | 第6-7页 |
1 绪论 | 第14-20页 |
1.1 研究背景与意义 | 第14-16页 |
1.2 本文要解决的关键问题 | 第16-17页 |
1.3 主要研究内容及思路 | 第17-18页 |
1.4 本文的章节安排 | 第18-20页 |
2 国内外研究概况 | 第20-32页 |
2.1 Hashtag研究概述 | 第20-21页 |
2.2 Hashtag相关基础研究 | 第21-23页 |
2.2.1 Hashtag基本特性及主要功能 | 第21-22页 |
2.2.2 Hashtag的使用现状及预处理 | 第22-23页 |
2.3 Hashtag生成研究概述 | 第23-26页 |
2.3.1 标签自动生成技术 | 第23-25页 |
2.3.2 Hashtag自动生成技术 | 第25-26页 |
2.4 Hashtag分类和聚类相关研究概述 | 第26-28页 |
2.4.1 Hashtag分类及其应用 | 第26-27页 |
2.4.2 Hashtag聚类及其应用 | 第27-28页 |
2.5 文本聚类结果描述与关键词抽取研究概述 | 第28-31页 |
2.5.1 文本聚类结果描述研究概述 | 第29页 |
2.5.2 关键词抽取研究概述 | 第29-31页 |
2.6 本章小结 | 第31-32页 |
3 多语言微博Hashtag生成研究 | 第32-41页 |
3.1 Hashtag生成研究思路 | 第32-33页 |
3.2 Hashtag生成中的文本表示方法 | 第33-35页 |
3.2.1 潜在语义分析模型 | 第33-34页 |
3.2.2 隐含狄利克雷分布模型 | 第34-35页 |
3.3 Hashtag生成实验结果与分析 | 第35-40页 |
3.3.1 实验数据说明 | 第35-37页 |
3.3.2 实验结果 | 第37-40页 |
3.4 本章小结 | 第40-41页 |
4 多语言微博Hashtag聚类研究 | 第41-55页 |
4.1 聚类算法概述 | 第41-44页 |
4.1.1 K-Means聚类算法 | 第41-42页 |
4.1.2 层次聚类算法 | 第42页 |
4.1.3 AP聚类算法 | 第42-43页 |
4.1.4 聚类结果评价指标 | 第43-44页 |
4.2 基于文档合并的Hashtag聚类实验 | 第44-51页 |
4.2.1 长文档中英文聚类实验 | 第44-48页 |
4.2.2 基于文档合并方法的Hashtag聚类 | 第48-51页 |
4.3 基于标签文档矩阵的Hashtag聚类实验 | 第51-53页 |
4.4 基于文档合并与标签文档矩阵的Hashtag聚类结果对比 | 第53-54页 |
4.4.1 两种不同聚类策略的中文Hashtag聚类结果对比 | 第53-54页 |
4.4.2 两种不同聚类策略的英文Hashtag聚类结果对比 | 第54页 |
4.5 本章小结 | 第54-55页 |
5 聚类结果描述及关键词抽取技术研究 | 第55-69页 |
5.1 关键词抽取问题分析 | 第55-59页 |
5.1.1 中文关键词抽取问题分析 | 第55-57页 |
5.1.2 英文关键词抽取问题分析 | 第57-59页 |
5.2 关键词抽取方法思路与关键技术 | 第59-66页 |
5.2.1 关键词抽取总体流程 | 第59-60页 |
5.2.2 关键抽取中的特征计算方法 | 第60-66页 |
5.3 实验与结果 | 第66-68页 |
5.3.1 特征归一化与结果评价 | 第66页 |
5.3.2 中文关键词抽取实验结果 | 第66-67页 |
5.3.3 英文关键词抽取实验结果 | 第67-68页 |
5.4 本章小结 | 第68-69页 |
6 基于Hashtag的多语微博热点事件发现 | 第69-87页 |
6.1 基于Hashtag的多语微博热点事件发现总体框架 | 第69-70页 |
6.2 基于Hashtag的中文微博热点事件发现 | 第70-76页 |
6.2.1 基于标签文档矩阵的Hashtag聚类结果可视化 | 第71-74页 |
6.2.2 基于文档合并的Hashtag聚类结果可视化 | 第74-76页 |
6.3 基于Hashtag的英文微博热点事件发现 | 第76-81页 |
6.3.1 基于标签文档矩阵的Hashtag聚类结果可视化 | 第77-80页 |
6.3.2 基于文档合并的Hashtag聚类结果可视化 | 第80-81页 |
6.4 基于Hashtag的中英文微博热点事件发现结果比较分析 | 第81-83页 |
6.5 “h7n9”热点事件的时间演化分析 | 第83-86页 |
6.6 本章小结 | 第86-87页 |
7 结论 | 第87-89页 |
7.1 研究总结 | 第87-88页 |
7.2 未来研究方向 | 第88-89页 |
致谢 | 第89-90页 |
参考文献 | 第90-101页 |
附录1:攻读硕士期间论文发表与项目参与情况 | 第101-102页 |
附录2:部分中文Hashtag文档关键词抽取结果 | 第102-103页 |
附录3:部分英文Hashtag文档关键词抽取结果 | 第103页 |