首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本分类中特征选择和分类算法的研究

摘要第1-4页
Abstract第4-5页
目录第5-7页
第一章 引言第7-12页
   ·研究背景和研究意义第7-8页
   ·问题描述第8-9页
   ·研究现状第9-10页
   ·研究内容与论文结构第10-11页
   ·本章小结第11-12页
第二章 文本分类与特征选择技术第12-22页
   ·文本特征的特点第12-13页
   ·文本预处理第13-14页
     ·中文分词第13页
     ·停用词过滤第13-14页
   ·文本的表示第14-15页
     ·布尔模型第14页
     ·向量空间模型第14页
     ·概率模型第14-15页
   ·特征选择第15-17页
   ·分类方法第17-19页
     ·决策树(Decision Tree)第17-18页
     ·朴素贝叶斯方法第18页
     ·最大熵模型第18页
     ·逻辑回归(Logistic Regression)第18-19页
     ·K最近邻算法第19页
   ·性能评估方法第19-20页
   ·本章小结第20-22页
第三章 特征项选择研究第22-28页
   ·TF-IDF算法思想第23-24页
   ·TF-IDF算法存在的不足第24页
   ·TF-IDF算法改进第24-27页
     ·文本预处理第26页
     ·特征属性的计算第26-27页
     ·特征项的优化思想第27页
   ·文章小结第27-28页
第四章 基于logistic回归的决策树分类算法研究第28-37页
   ·决策树算法介绍(DT)第28-32页
     ·信息熵第29-30页
     ·信息增益第30页
     ·信息增益率第30-32页
   ·逻辑回归算法分析(LR)第32-34页
     ·显著性分析第33页
     ·逐步回归第33-34页
   ·基于logistic回归的决策树分类算法(LR-DT)第34-35页
   ·本章小结第35-37页
第五章 算法实现与实验分析第37-48页
   ·改进的TF-IDF算法特征项选取的实验分析第37-41页
     ·实验设计方案第37-38页
     ·实验结果对比和分析第38-40页
     ·算法实现的主要方法介绍第40-41页
   ·基于logistic回归的决策树分类算法实验分析第41-47页
     ·实验设计方案第41-42页
     ·实验和分析第42-47页
   ·本章总结第47-48页
第六章 总结和展望第48-49页
参考文献第49-52页
致谢第52-53页
个人简介第53页

论文共53页,点击 下载论文
上一篇:基于多视图的三维重建中特征提取与特征匹配并行化研究
下一篇:基于大容量指纹库的多级指纹分类研究