首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于特征选择及LDA模型的中文文本分类研究与实现

摘要第1-5页
Abstract第5-7页
目录第7-10页
第一章 绪论第10-17页
   ·课题研究背景及意义第10-12页
   ·文本分类研究现状第12-14页
     ·国外研究现状第12-13页
     ·国内研究现状第13-14页
   ·论文的主要研究内容第14-15页
   ·论文的组织第15-17页
第二章 中文文本分类技术综述第17-46页
   ·文本分类流程概述第17-18页
   ·预处理第18-20页
   ·特征选择第20-24页
     ·词频第20-21页
     ·信息第21-22页
     ·信息增益第22-23页
     ·CHI统计量第23-24页
     ·期望交叉熵第24页
     ·文本证据权第24页
   ·文本表示第24-34页
     ·向量空间模型第25-26页
     ·概率模型第26-27页
     ·主题模型第27-34页
       ·PLSA第27-31页
         ·LSI第27-29页
         ·pLSA第29-31页
       ·LDA第31-34页
         ·LDA模型的训练第33页
         ·LDA模型的推断第33-34页
   ·常用文本分类算法第34-45页
     ·朴素贝叶斯分类第34-36页
     ·Rocchio第36页
     ·kNN第36-37页
     ·决策树第37-38页
     ·支持向量机第38-45页
       ·统计学习理论第38-40页
       ·SVM基本思想第40-44页
       ·支持向量机多分类问题第44-45页
   ·本章小结第45-46页
第三章 改进的特征选择方法与LDA结合第46-53页
   ·互信息特征选择方法第46-50页
     ·传统互信息特征选择方法的不足第46-47页
     ·传统互信息特征选择方法的改进第47-50页
   ·信息增益特征选择方法第50-51页
     ·传统信息增益特征选择方法的不足第50-51页
     ·传统信息增益特征选择方法的改进第51页
   ·改进的特征选择方法与LDA模型结合第51-52页
   ·本章小结第52-53页
第四章 实验与结果分析第53-73页
   ·基于特征选择及LDA的中文文本分类流程第53页
   ·软硬件环境第53-54页
   ·实验语料库和结果评估指标第54-55页
     ·实验语料库第54页
     ·实验结果评估指标第54-55页
   ·文本预处理第55-57页
   ·特征选择第57-60页
     ·改进的特征选择核心代码第57-59页
     ·特征词典大小的确定第59-60页
   ·LDA建模第60-64页
     ·LDA相关变量的初始化第60-62页
     ·LDA模型第62-64页
   ·SVM文本分类和结果分析第64-72页
     ·输入处理及参数寻优第64-66页
     ·实验结果及分析第66-72页
       ·平衡语料集上实验结果及分析第66-69页
       ·不平衡数据集上实验结果与分析第69-72页
   ·本章小结第72-73页
第五章 总结与展望第73-75页
   ·工作总结第73-74页
   ·展望第74-75页
参考文献第75-80页
致谢第80页

论文共80页,点击 下载论文
上一篇:基于二分图的查询推荐算法
下一篇:基于BTM主题模型特征扩展的短文本相似度计算