基于Labeled LDA的微博用户兴趣识别系统的研究与实现
| 致谢 | 第5-6页 |
| 摘要 | 第6-7页 |
| ABSTRACT | 第7页 |
| 序言 | 第8-11页 |
| 1 引言 | 第11-14页 |
| 1.1 研究背景 | 第11页 |
| 1.2 研究现状 | 第11-12页 |
| 1.3 研究意义与目标 | 第12页 |
| 1.4 论文组织结构 | 第12-14页 |
| 2 相关技术简介 | 第14-29页 |
| 2.1 中文分词 | 第14-15页 |
| 2.2 文本分类 | 第15-20页 |
| 2.2.1 朴素贝叶斯 | 第15-16页 |
| 2.2.2 支持向量机 | 第16-18页 |
| 2.2.3 人工神经网络 | 第18-20页 |
| 2.3 主题模型 | 第20-29页 |
| 2.3.1 LSA | 第20-22页 |
| 2.3.2 PLSA | 第22-23页 |
| 2.3.3 LDA | 第23-26页 |
| 2.3.4 Labeled LDA | 第26-29页 |
| 3 系统分析与设计 | 第29-34页 |
| 3.1 需求分析 | 第29-30页 |
| 3.2 概要设计 | 第30-32页 |
| 3.3 详细设计 | 第32-34页 |
| 4 系统实现 | 第34-45页 |
| 4.1 微博爬取模块 | 第34-37页 |
| 4.2 中文分词模块 | 第37-38页 |
| 4.3 预处理模块 | 第38-39页 |
| 4.4 兴趣识别模块 | 第39-42页 |
| 4.5 结果可视化模块 | 第42-45页 |
| 5 系统分布式扩展 | 第45-50页 |
| 5.1 Hadoop与MapReduce | 第45-47页 |
| 5.2 分布式中文切词 | 第47-49页 |
| 5.3 分布式预处理 | 第49-50页 |
| 6 实验与评测 | 第50-55页 |
| 6.1 实验数据 | 第50-51页 |
| 6.2 实验步骤 | 第51页 |
| 6.3 实验结果与分析 | 第51-55页 |
| 7 总结与展望 | 第55-56页 |
| 参考文献 | 第56-58页 |
| 附录A | 第58-60页 |
| 作者简历及攻读硕士专业学位期间取得的研究成果 | 第60-62页 |
| 学位论文数据集 | 第62页 |