Web挖掘中的主题模型扩展

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-15页
·研究背景及意义	第9-10页
·相关工作	第10-13页
·本文的主要工作和创新点	第13-14页
·论文的结构安排	第14-15页
第二章主题模型概述	第15-32页
·基础知识	第16-20页
·贝叶斯网络图	第16-17页
·多项式分布	第17页
·共轭先验分布	第17-18页
·狄利克雷分布	第18-19页
·隐含变量模型	第19页
·贝叶斯层级模型	第19页
·概率共轭	第19页
·特征选择	第19-20页
·文本预处理	第20页
·文本表示模型	第20-22页
·布尔模型	第20页
·向量空间模型	第20-21页
·文档频率频度模型	第21-22页
·语言模型	第22页
·经典主题模型	第22-31页
·潜在语义分析模型	第22-23页
·概率潜在语义分析模型	第23-24页
·潜在狄利克雷分配模型	第24-28页
·附加类别标签的LDA模型	第28-29页
·层次LDA模型	第29-31页
·本章小结	第31-32页
第三章作者主题模型	第32-39页
·作者主题模型的优势	第32-33页
·吉布斯取样	第33-35页
·作者主题模型的推导	第35-39页
第四章基于用户与关联的扩展LDA模型	第39-47页
·提出改进ATM模型的原因	第39-40页
·改进ATM模型——用户与关联扩展LDA模型	第40-41页
·改进模型的推导	第41-42页
·实验及结果分析	第42-47页
·数据准备	第42-43页
·确定最佳主题数数目	第43-44页
·计算主题模型相似度的公式	第44页
·实验过程	第44-46页
·实验结果比较	第46-47页
第五章总结与展望	第47-48页
·总结	第47页
·展望	第47-48页
参考文献	第48-52页
致谢	第52-53页
攻读硕士学位期间发表的学术论文	第53页