概率主题模型在文本分类中的应用研究

摘要	第1-5页
ABSTRACT	第5-9页
第1章绪论	第9-15页
·研究背景	第9-11页
·文本分类技术	第11-13页
·发展阶段	第11-12页
·存在的不足	第12-13页
·本文主要工作和贡献	第13页
·论文组织结构	第13-15页
第2章文本分类概述	第15-27页
·文本分类的一般性描述	第15-16页
·文本分类的关键问题	第16-21页
·训练文本集	第16页
·文本的表示模型	第16-17页
·特征选择	第17-21页
·常用文本分类方法	第21-25页
·简单向量距离分类法	第21页
·KNN（K 最近邻居）算法	第21-22页
·贝叶斯分类法	第22-23页
·基于投票的方法	第23页
·支持向量机（SVM）	第23-24页
·其他分类方法	第24-25页
·性能评价标准	第25-27页
第3章基于概率主题模型的文本生成方法	第27-40页
·概率主题模型简介	第27-31页
·TF-IDF 模型	第28页
·一元混合模型（Mixture of unigrams）	第28-29页
·LSI 模型	第29页
·pLSI 模型	第29-31页
·LDA（LATENT DIRICHLET ALLOCATION）模型	第31-35页
·模型描述	第31-33页
·抽取算法	第33-35页
·基于LDA 概率主题模型的文本生成	第35-36页
·实验及分析	第36-38页
·本章小结	第38-40页
第4章基于概率主题模型的数据偏斜文本分类	第40-55页
·数据偏斜	第40-48页
·数据偏斜分析	第41-42页
·数据偏斜处理方法	第42-47页
·研究趋势	第47-48页
·基于LDA 模型的偏斜文本分类算法	第48-50页
·基本思路	第48-49页
·算法设计	第49-50页
·实验及分析	第50-53页
·实验设置	第50-51页
·实验结果分析	第51-53页
·本章小结	第53-55页
第5章基于概率主题模型的噪声处理方法研究	第55-64页
·文本分类中的噪声问题	第55页
·基于LDA 的噪声处理	第55-59页
·数据平滑	第55-57页
·基于类别熵的噪声识别	第57页
·算法设计	第57-59页
·实验及分析	第59-62页
·实验设计	第59-60页
·实验结果分析	第60-62页
·本章小结	第62-64页
第6章结论与工作展望	第64-67页
·结论	第64-65页
·进一步的工作	第65-67页
参考文献	第67-71页
致谢	第71-72页
在读期间发表的学术论文与取得的研究成果	第72页