基于文档频率的分级主题模型
摘要 | 第1-5页 |
ABSTRACT | 第5-8页 |
第1章 自然语言处理 | 第8-14页 |
·自然语言处理的发展现状 | 第8-11页 |
·论文的研究背景 | 第11-12页 |
·论文的研究内容 | 第12-13页 |
·论文的结构 | 第13-14页 |
第2章 统计语言模型 | 第14-23页 |
·文本处理 | 第14-21页 |
·文本的表示 | 第15-16页 |
·特征项的抽取 | 第16-17页 |
·训练方法与分类算法 | 第17-20页 |
·评估方法 | 第20-21页 |
·贝叶斯方法 | 第21-23页 |
第3章 基于词频的分级统计主题模型DF-LDA | 第23-31页 |
·图模型 | 第23-27页 |
·无向图模型的表示 | 第24-25页 |
·有向图模型的表示 | 第25-27页 |
·LDA模型 | 第27-28页 |
·分级主题模型(DF-LDA) | 第28-29页 |
·DF-LDA模型的生成过程 | 第29-31页 |
第4章 DF-LDA主题模型的求解 | 第31-34页 |
·Gibbs抽样方法 | 第31-32页 |
·DF-LDA模型的求解 | 第32-34页 |
第5章 实验与分析 | 第34-37页 |
·分级主题抽取实验 | 第34页 |
·生成概率比较实验 | 第34-37页 |
第6章 结论 | 第37-38页 |
参考文献 | 第38-42页 |
致谢 | 第42-43页 |
攻读硕士期间发表学术论文 | 第43页 |