摘要 | 第5-7页 |
abstract | 第7-8页 |
第1章 绪论 | 第12-33页 |
1.1 课题研究背景和意义 | 第12-14页 |
1.2 微博数据挖掘研究现状 | 第14-31页 |
1.2.1 话题事件检测 | 第15-18页 |
1.2.2 社区发现 | 第18-22页 |
1.2.3 情感分析 | 第22-28页 |
1.2.4 影响力分析 | 第28-31页 |
1.3 论文主要内容及章节安排 | 第31-33页 |
第2章 微博中流行子话题与时序模式推断方法 | 第33-50页 |
2.1 问题描述 | 第33-35页 |
2.2 相关研究 | 第35-37页 |
2.2.1 概率主题模型 | 第35-36页 |
2.2.2 话题与时序模式 | 第36-37页 |
2.3 相关定义 | 第37-38页 |
2.4 PARTIAL_SEED_LDA_TIME模型 | 第38-42页 |
2.4.1 模型的提出 | 第38-39页 |
2.4.2 话题隐变量推断 | 第39-42页 |
2.5 实验结果及分析 | 第42-49页 |
2.5.1 数据获取 | 第42-43页 |
2.5.2 实验参数设置 | 第43页 |
2.5.3 收敛速度验证 | 第43-45页 |
2.5.4 流行子话题发现有效性验证 | 第45-47页 |
2.5.5 流行子话题时序模式分析 | 第47-49页 |
2.6 本章小结 | 第49-50页 |
第3章 微博中基于频繁子树挖掘的群落挖掘技术 | 第50-70页 |
3.1 问题描述 | 第50-52页 |
3.2 相关定义 | 第52-54页 |
3.3 算法过程 | 第54-62页 |
3.3.1 数据分析 | 第54页 |
3.3.2 剪枝 | 第54-58页 |
3.3.3 挖掘 | 第58-62页 |
3.4 实验结果及分析 | 第62-69页 |
3.4.1 剪枝规模 | 第62-63页 |
3.4.2 算法性能分析 | 第63页 |
3.4.3 群落形状模式分析 | 第63-65页 |
3.4.4 影响力分析 | 第65-66页 |
3.4.5 社区和群落的区别分析 | 第66-68页 |
3.4.6 群落案例研究 | 第68-69页 |
3.5 本章小结 | 第69-70页 |
第4章 基于突发事件的博主情感分析 | 第70-85页 |
4.1 问题描述 | 第70-72页 |
4.2 模型及方法 | 第72-81页 |
4.2.1 形式化定义 | 第72页 |
4.2.2 文本链式模型 | 第72-75页 |
4.2.3 评价对象检测 | 第75-78页 |
4.2.4 基于语气词库的用户情感分析 | 第78-81页 |
4.3 实验结果及分析 | 第81-84页 |
4.3.1 数据集 | 第81-82页 |
4.3.2 实验设置及结果 | 第82-84页 |
4.4 本章小结 | 第84-85页 |
第5章 微博中的影响团伙挖掘技术 | 第85-108页 |
5.1 问题描述 | 第85-87页 |
5.2 问题定义 | 第87-90页 |
5.3 内容扩散树扩展方法 | 第90-91页 |
5.3.1 消除扩散级联树的有向性 | 第90页 |
5.3.2 增加未扩展边 | 第90-91页 |
5.4 TEAM-FGM | 第91-94页 |
5.5 实验结果及分析 | 第94-106页 |
5.5.1 数据采集 | 第94-95页 |
5.5.2 数据分析与预处理 | 第95-96页 |
5.5.3 Team-FGM算法优点 | 第96-98页 |
5.5.4 不同参数下的实验结果对比 | 第98-103页 |
5.5.5 实验结果有效性验证 | 第103-106页 |
5.6 本章小结 | 第106-108页 |
结论 | 第108-111页 |
参考文献 | 第111-129页 |
攻读博士学位期间发表的论文和取得的科研成果 | 第129-130页 |
致谢 | 第130页 |