首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

概率主题模型在文本分类中的应用研究

摘要第1-5页
ABSTRACT第5-9页
第1章 绪论第9-15页
   ·研究背景第9-11页
   ·文本分类技术第11-13页
     ·发展阶段第11-12页
     ·存在的不足第12-13页
   ·本文主要工作和贡献第13页
   ·论文组织结构第13-15页
第2章 文本分类概述第15-27页
   ·文本分类的一般性描述第15-16页
   ·文本分类的关键问题第16-21页
     ·训练文本集第16页
     ·文本的表示模型第16-17页
     ·特征选择第17-21页
   ·常用文本分类方法第21-25页
     ·简单向量距离分类法第21页
     ·KNN(K 最近邻居)算法第21-22页
     ·贝叶斯分类法第22-23页
     ·基于投票的方法第23页
     ·支持向量机(SVM)第23-24页
     ·其他分类方法第24-25页
   ·性能评价标准第25-27页
第3章 基于概率主题模型的文本生成方法第27-40页
   ·概率主题模型简介第27-31页
     ·TF-IDF 模型第28页
     ·一元混合模型(Mixture of unigrams)第28-29页
     ·LSI 模型第29页
     ·pLSI 模型第29-31页
   ·LDA(LATENT DIRICHLET ALLOCATION)模型第31-35页
     ·模型描述第31-33页
     ·抽取算法第33-35页
   ·基于LDA 概率主题模型的文本生成第35-36页
   ·实验及分析第36-38页
   ·本章小结第38-40页
第4章 基于概率主题模型的数据偏斜文本分类第40-55页
   ·数据偏斜第40-48页
     ·数据偏斜分析第41-42页
     ·数据偏斜处理方法第42-47页
     ·研究趋势第47-48页
   ·基于LDA 模型的偏斜文本分类算法第48-50页
     ·基本思路第48-49页
     ·算法设计第49-50页
   ·实验及分析第50-53页
     ·实验设置第50-51页
     ·实验结果分析第51-53页
   ·本章小结第53-55页
第5章 基于概率主题模型的噪声处理方法研究第55-64页
   ·文本分类中的噪声问题第55页
   ·基于LDA 的噪声处理第55-59页
     ·数据平滑第55-57页
     ·基于类别熵的噪声识别第57页
     ·算法设计第57-59页
   ·实验及分析第59-62页
     ·实验设计第59-60页
     ·实验结果分析第60-62页
   ·本章小结第62-64页
第6章 结论与工作展望第64-67页
   ·结论第64-65页
   ·进一步的工作第65-67页
参考文献第67-71页
致谢第71-72页
在读期间发表的学术论文与取得的研究成果第72页

论文共72页,点击 下载论文
上一篇:人脸变换与识别:从近红外到可见光图像
下一篇:灾害应急救助物资调度系统研究