摘要 | 第3-5页 |
Abstract | 第5-6页 |
第一章 绪论 | 第10-14页 |
1.1 研究背景与意义 | 第10页 |
1.2 国内外研究现状 | 第10-11页 |
1.3 本文的主要工作 | 第11-12页 |
1.4 本文的组织结构 | 第12-14页 |
第二章 基础知识及相关技术概述 | 第14-24页 |
2.1 基础数学知识 | 第14-21页 |
2.1.1 贝叶斯网络图 | 第14-15页 |
2.1.2 概率密度函数 | 第15-16页 |
2.1.3 贝叶斯估计 | 第16页 |
2.1.4 Multinomial分布 | 第16-17页 |
2.1.5 Dirichlet分布 | 第17-18页 |
2.1.6 Dirichlet-Multionmial共扼 | 第18-19页 |
2.1.7 马尔科夫链 | 第19-21页 |
2.2 预处理 | 第21-22页 |
2.2.0 切分文档 | 第21-22页 |
2.2.1 文本分词 | 第22页 |
2.2.2 去停用词 | 第22页 |
2.3 实验评判标准 | 第22-23页 |
2.3.1 F1值 | 第22-23页 |
2.3.2 困惑度 | 第23页 |
2.4 本章小结 | 第23-24页 |
第三章 主题模型 | 第24-44页 |
3.1 模型简介 | 第24页 |
3.2 主题模型的工作原理 | 第24-25页 |
3.3 主题模型的主要作用 | 第25-26页 |
3.4 传统主题模型 | 第26-30页 |
3.4.1 LSI | 第26-27页 |
3.4.2 pLSI | 第27-29页 |
3.4.3 一元混合模型 | 第29-30页 |
3.5 LDA主题模型 | 第30-38页 |
3.5.1 LDA模型表示 | 第31-33页 |
3.5.2 LDA模型参数估计 | 第33-38页 |
3.6 BTM主题模型 | 第38-42页 |
3.6.1 BTM模型表示 | 第38-41页 |
3.6.2 BTM参数估计 | 第41-42页 |
3.7 本章小结 | 第42-44页 |
第四章 本文提出的扩展主题模型及实验 | 第44-60页 |
4.1 bLDA扩展主题模型 | 第44-49页 |
4.1.1 bLDA模型的提出 | 第44-45页 |
4.1.2 “词对biterm”的生成 | 第45页 |
4.1.3 bLDA模型表示 | 第45-48页 |
4.1.4 bLDA模型参数估计 | 第48-49页 |
4.2 实验与分析 | 第49-58页 |
4.2.1 实验数据集 | 第49-50页 |
4.2.2 实验环境 | 第50-51页 |
4.2.3 分类实验 | 第51-54页 |
4.2.4 分类结果分析 | 第54-55页 |
4.2.5 Perplexity评估 | 第55-56页 |
4.2.6 Perplexity实验分析 | 第56-57页 |
4.2.7 时间复杂度 | 第57-58页 |
4.3 实验结果总结 | 第58-59页 |
4.4 本章小结 | 第59-60页 |
第五章 总结与展望 | 第60-61页 |
参考文献 | 第61-65页 |
致谢 | 第65-66页 |
攻读硕士期间发表的学术论文 | 第66页 |