基于短文本分析的用户兴趣建模
摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第一章 引言 | 第8-10页 |
1.1 课题研究背景与意义 | 第8页 |
1.2 主要的研究工作 | 第8-9页 |
1.3 论文结构 | 第9-10页 |
第二章 短文本处理技术 | 第10-24页 |
2.1 中文分词和新词发现研究 | 第10-14页 |
2.1.1 中文分词研究 | 第10-12页 |
2.1.2 新词发现研究 | 第12-14页 |
2.2 关键词抽取和扩展 | 第14-18页 |
2.2.1 关键词抽取 | 第14-15页 |
2.2.2 关键词扩展 | 第15-18页 |
2.3 深度学习用于自然语言处理研究 | 第18-22页 |
2.3.1 词向量训练 | 第19-21页 |
2.3.2 文章向量原理和训练 | 第21-22页 |
2.4 本章小结 | 第22-24页 |
第三章 短文本分类技术 | 第24-38页 |
3.1 微博用户数据采集和研究 | 第24-27页 |
3.1.1 微博数据采集和抽样分析 | 第24-25页 |
3.1.2 微博文本分类特殊性分析 | 第25页 |
3.1.3 微博分布分析 | 第25-26页 |
3.1.4 微博内容分布研究 | 第26-27页 |
3.2 短文本分类研究 | 第27-35页 |
3.2.1 微博分类体系设计 | 第27页 |
3.2.2 短文本分类 | 第27-35页 |
3.3 短文本分类用于用户兴趣建模 | 第35-37页 |
3.3.1 短文本整体分类分析 | 第35-37页 |
3.3.2 短文本分类应用 | 第37页 |
3.4 本章小结 | 第37-38页 |
第四章 基于关键词扩展的微博用户兴趣抽取 | 第38-52页 |
4.1 微博关键词抽取 | 第38-41页 |
4.1.1 微博用户兴趣关键词抽取方法研究 | 第38页 |
4.1.2 微博关键词抽取 | 第38-41页 |
4.2 关键词扩展在用户兴趣抽取方面的应用 | 第41-47页 |
4.2.1 用户兴趣点抽取 | 第42-44页 |
4.2.2 用户兴趣类抽取 | 第44-47页 |
4.3 关键词聚类在用户兴趣抽取方面的应用 | 第47-50页 |
4.3.1 用户关键词聚类研究 | 第47-48页 |
4.3.2 关键词聚类用于用户兴趣抽取 | 第48-49页 |
4.3.3 实验结果和分析 | 第49-50页 |
4.4 本章小结 | 第50-52页 |
第五章 基于LDA和用户向量的用户兴趣建模工作 | 第52-62页 |
5.1 基于主题模型的用户兴趣建模 | 第52-55页 |
5.1.1 利用LDA主题模型进行微博文本建模 | 第52-53页 |
5.1.2 主题模型训练 | 第53页 |
5.1.3 兴趣主题抽取 | 第53-54页 |
5.1.4 微博用户兴趣抽取 | 第54-55页 |
5.2 基于用户向量的社区关系网络构建 | 第55-60页 |
5.2.1 用户向量训练研究 | 第55-59页 |
5.2.2 基于用户微博的社区关系构建 | 第59-60页 |
5.3 本章小结 | 第60-62页 |
第六章 总结与展望 | 第62-64页 |
6.1 论文工作总结 | 第62页 |
6.2 不足与展望 | 第62-64页 |
参考文献 | 第64-66页 |
致谢 | 第66页 |