面向社会媒体的文本和属性分析技术研究
摘要 | 第5-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第14-30页 |
1.1 本论文研究的目的和意义 | 第14-16页 |
1.2 国内外研究现状及发展趋势 | 第16-25页 |
1.2.1 主题模型 | 第16-24页 |
1.2.2 社会媒体中用户属性研究 | 第24-25页 |
1.3 研究内容及创新点 | 第25-26页 |
1.4 论文的组织结构 | 第26-30页 |
第2章 辩论文本中的组织短语挖掘 | 第30-56页 |
2.1 引言 | 第30-34页 |
2.2 相关工作 | 第34-36页 |
2.2.1 基于隐马模型的主题模型 | 第34-35页 |
2.2.2 基于在线论坛的研究 | 第35页 |
2.2.3 辩论分析 | 第35-36页 |
2.2.4 篇章分析 | 第36页 |
2.3 shell主题模型(STM) | 第36-44页 |
2.3.1 设计背景 | 第36-38页 |
2.3.2 模型 | 第38-40页 |
2.3.3 模型学习 | 第40-44页 |
2.4 实验 | 第44-53页 |
2.4.1 数据集和实验设置 | 第44-45页 |
2.4.2 内在评估 | 第45-47页 |
2.4.3 外在评估 | 第47-49页 |
2.4.4 定性分析和混乱度分析 | 第49-53页 |
2.5 本章小结 | 第53-56页 |
第3章 基于转发行为的微博阅读概率模型 | 第56-76页 |
3.1 引言 | 第56-58页 |
3.2 相关工作 | 第58-59页 |
3.3 ReadBehavior模型 | 第59-66页 |
3.3.1 术语、假设和事实 | 第59-61页 |
3.3.2 模型 | 第61-66页 |
3.3.3 时间复杂度分析 | 第66页 |
3.4 改进的PageRank算法 | 第66-69页 |
3.5 实验 | 第69-75页 |
3.5.1 twitter数据集 | 第69-70页 |
3.5.2 数据分布 | 第70-71页 |
3.5.3 IPR与其他相关算法的比较 | 第71-73页 |
3.5.4 用户推荐任务 | 第73-75页 |
3.6 本章小结 | 第75-76页 |
第4章 基于文档相对相似性的主题模型 | 第76-96页 |
4.1 引言 | 第76-78页 |
4.2 相关工作 | 第78-79页 |
4.2.1 增强的主题模型 | 第78-79页 |
4.2.2 带正则项的主题模型 | 第79页 |
4.3 模型 | 第79-83页 |
4.3.1 约束 | 第80-81页 |
4.3.2 LDA | 第81页 |
4.3.3 正则化模型 | 第81-83页 |
4.4 模型学习 | 第83-86页 |
4.4.1 E步骤 | 第83-84页 |
4.4.2 M步骤 | 第84-86页 |
4.5 实验 | 第86-94页 |
4.5.1 数据集 | 第86-88页 |
4.5.2 实验设置 | 第88页 |
4.5.3 定量评估 | 第88-94页 |
4.5.4 定性评估 | 第94页 |
4.6 本章小结 | 第94-96页 |
第5章 总结与展望 | 第96-100页 |
5.1 工作总结 | 第96-97页 |
5.2 未来工作展望 | 第97-100页 |
参考文献 | 第100-112页 |
攻读博士学位期间发表的论文 | 第112-114页 |
攻读博士学位期间申请的专利 | 第114-116页 |
攻读博士学位期间参加的科研项目 | 第116-118页 |
致谢 | 第118-120页 |
作者简介 | 第120页 |