基于文档频率的分级主题模型
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-8页 |
| 第1章 自然语言处理 | 第8-14页 |
| ·自然语言处理的发展现状 | 第8-11页 |
| ·论文的研究背景 | 第11-12页 |
| ·论文的研究内容 | 第12-13页 |
| ·论文的结构 | 第13-14页 |
| 第2章 统计语言模型 | 第14-23页 |
| ·文本处理 | 第14-21页 |
| ·文本的表示 | 第15-16页 |
| ·特征项的抽取 | 第16-17页 |
| ·训练方法与分类算法 | 第17-20页 |
| ·评估方法 | 第20-21页 |
| ·贝叶斯方法 | 第21-23页 |
| 第3章 基于词频的分级统计主题模型DF-LDA | 第23-31页 |
| ·图模型 | 第23-27页 |
| ·无向图模型的表示 | 第24-25页 |
| ·有向图模型的表示 | 第25-27页 |
| ·LDA模型 | 第27-28页 |
| ·分级主题模型(DF-LDA) | 第28-29页 |
| ·DF-LDA模型的生成过程 | 第29-31页 |
| 第4章 DF-LDA主题模型的求解 | 第31-34页 |
| ·Gibbs抽样方法 | 第31-32页 |
| ·DF-LDA模型的求解 | 第32-34页 |
| 第5章 实验与分析 | 第34-37页 |
| ·分级主题抽取实验 | 第34页 |
| ·生成概率比较实验 | 第34-37页 |
| 第6章 结论 | 第37-38页 |
| 参考文献 | 第38-42页 |
| 致谢 | 第42-43页 |
| 攻读硕士期间发表学术论文 | 第43页 |