首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于LDA模型的文本分类研究

摘要第1-4页
Abstract第4-8页
1 绪论第8-15页
   ·研究背景和选题意义第8-9页
   ·国内外研究现状第9-13页
     ·文本表示第11页
     ·表示空间降维第11-12页
     ·机器学习分类方法第12-13页
   ·本文的研究内容第13页
   ·论文的组织第13-15页
2 文本分类的技术第15-31页
   ·文本分类问题的定义第15-18页
     ·两类问题第16-17页
     ·多类问题第17页
     ·多标记问题第17-18页
   ·文本预处理第18-19页
   ·文档表示第19-20页
   ·特征提取第20-24页
     ·文档频次(DF)第21页
     ·信息增益(IG)第21-22页
     ·互信息(MI)第22-23页
     ·x~2统计(CHI)及其改进第23-24页
     ·主成分分析(PCA)第24页
   ·文本分类算法第24-30页
     ·K最近相邻算法第25页
     ·神经网络第25-26页
     ·决策树第26页
     ·贝叶斯算法第26-27页
     ·支持向量机第27-30页
   ·本章小结第30-31页
3 基于LDA模型的文本分类第31-52页
   ·统计主题模型简介第31-37页
     ·TF-IDF模型第32-33页
     ·一元混合模型第33-34页
     ·LSI模型第34-36页
     ·PLSI模型第36-37页
   ·LDA模型的基本思想第37-39页
   ·基于LDA模型的文本分类第39-42页
     ·模型选择第40-41页
     ·参数估计第41-42页
   ·搭建实验环境第42-46页
     ·支持向量机训练环境第42页
     ·LDA建模平台第42-45页
     ·数据集第45-46页
     ·评估方法第46页
   ·实验与结果分析第46-51页
   ·本章小结第51-52页
4 最优主题数选择方法第52-60页
   ·LDA模型初始参数取值第52页
   ·基于HDP的最优主题数选择方法第52-54页
   ·基于DBSCAN的最优主题数选择方法第54-56页
     ·最优模型与主题相似度之间的关系第54-55页
     ·基于DBSCAN的最优主题数选择算法第55-56页
   ·实验与结果分析第56-58页
   ·本章小结第58-60页
5 总结与展望第60-61页
   ·本文工作第60页
   ·工作展望第60-61页
致谢第61-62页
参考文献第62-65页
附录第65页

论文共65页,点击 下载论文
上一篇:基于Simulink/Adams的多轴车辆ABS/ASR系统仿真研究
下一篇:XML与模式匹配技术及其应用研究