摘要 | 第4-6页 |
Abstract | 第6-8页 |
第1章 绪论 | 第15-30页 |
1.1 研究背景及意义 | 第15-19页 |
1.1.1 社会化媒体中的文本数据 | 第16-17页 |
1.1.2 社会化媒体中的用户关系数据 | 第17-18页 |
1.1.3 社会化媒体中的聚类方法 | 第18-19页 |
1.2 国内外研究现状及分析 | 第19-24页 |
1.2.1 基于HTML标签信息的网页内容聚类方法 | 第19-20页 |
1.2.2 文本数据聚类方法 | 第20-22页 |
1.2.3 用户主题和用户社区聚类方法 | 第22-24页 |
1.2.4 主要存在问题 | 第24页 |
1.3 研究工作及特色 | 第24-28页 |
1.3.1 主要研究内容 | 第24-27页 |
1.3.2 主要研究成果和创新 | 第27-28页 |
1.4 论文组织结构 | 第28-30页 |
第2章 社会化媒体网页内容自动聚类算法 | 第30-54页 |
2.1 研究动机 | 第30-31页 |
2.2 语义模块和子树结构映射模型 | 第31-36页 |
2.2.1 DOM树的生成 | 第31-32页 |
2.2.2 对应关系假设 | 第32页 |
2.2.3 DOM树中的基本结构 | 第32-36页 |
2.3 TPS:一种基于DOM树子树结构的无监督网页分块算法 | 第36-44页 |
2.3.1 问题定义:基于子树结构的分割模型 | 第37-38页 |
2.3.2 TPS算法 | 第38-40页 |
2.3.3 实验验证 | 第40-44页 |
2.4 GPPS:基于图分割理论的无监督网页分块算法 | 第44-52页 |
2.4.1 图分割理论下的问题定义 | 第44-45页 |
2.4.2 分块算法中的限制 | 第45-46页 |
2.4.3 GPPS算法 | 第46-48页 |
2.4.4 实验验证 | 第48-52页 |
2.5 小结 | 第52-54页 |
第3章 社会化媒体文本流中突发词聚类算法 | 第54-71页 |
3.1 研究动机 | 第54-55页 |
3.2 问题定义 | 第55-56页 |
3.3 基于主题的突发事件侦测 | 第56-59页 |
3.3.1 基于主题的突发事件侦测算法的概率框架 | 第56页 |
3.3.2 鉴别突发词 | 第56-57页 |
3.3.3 聚类突发词 | 第57-59页 |
3.3.4 计算事件的背景主题 | 第59页 |
3.4 实验结果及分析 | 第59-67页 |
3.4.1 数据集 | 第60页 |
3.4.2 事件聚类的评价指标 | 第60-61页 |
3.4.3 方法性能评价 | 第61-62页 |
3.4.4 事件发现可视化展示 | 第62-66页 |
3.4.5 通过主题追踪事件的变化 | 第66-67页 |
3.5 小结 | 第67-71页 |
第4章 社会化媒体文本流中主题词聚类算法 | 第71-86页 |
4.1 研究动机 | 第71-72页 |
4.2 问题定义 | 第72页 |
4.3 主题事件侦测 | 第72-76页 |
4.3.1 主题事件侦测追踪算法的概率框架 | 第72-73页 |
4.3.2 主题对应的事件 | 第73页 |
4.3.3 聚类主题词 | 第73-76页 |
4.3.4 主题事件追踪 | 第76页 |
4.4 实验结果及分析 | 第76-85页 |
4.4.1 对比算法 | 第76页 |
4.4.2 数据集 | 第76-77页 |
4.4.3 事件聚类的评价指标 | 第77页 |
4.4.4 事件内聚性评估 | 第77-78页 |
4.4.5 事件发现可视化展示 | 第78-81页 |
4.4.6 追踪事件和检测事件的发展趋势 | 第81-85页 |
4.5 小结 | 第85-86页 |
第5章 社会化媒体中文本和链接协同聚类模型 | 第86-109页 |
5.1 研究动机 | 第86-88页 |
5.2 作者-主题-社区模型 | 第88-94页 |
5.2.1 作者主题模型 | 第88-89页 |
5.2.2 主题-链接潜在狄利克雷划分模型 | 第89-90页 |
5.2.3 作者-主题-社区模型 | 第90-91页 |
5.2.4 模型推导和参数估计 | 第91-94页 |
5.3 实验结果及分析 | 第94-108页 |
5.3.1 人工数据集描述 | 第94-95页 |
5.3.2 真实数据集描述 | 第95-97页 |
5.3.3 性能评价指标 | 第97-98页 |
5.3.4 模拟数据实验 | 第98-101页 |
5.3.5 真实数据集上的性能比较 | 第101-107页 |
5.3.6 时间复杂度分析 | 第107-108页 |
5.4 小结 | 第108-109页 |
结论 | 第109-111页 |
参考文献 | 第111-124页 |
附录A 用户的主题和社区协同聚类模型的相关证明 | 第124-129页 |
A.1 模型的似然函数 | 第124页 |
A.2 变分推导 | 第124-126页 |
A.3 参数估计 | 第126-129页 |
附录B 突发词聚类的相关图表 | 第129-131页 |
附录C 主题词聚类的相关图表 | 第131-134页 |
攻读博士学位期间发表的论文及其他成果 | 第134-137页 |
致谢 | 第137-138页 |
个人简历 | 第138页 |