首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本分类特征选取技术研究

摘要第1-6页
ABSTRACT第6-8页
目录第8-11页
图表目录第11-12页
第一章 引言第12-15页
   ·课题研究背景及意义第12-13页
   ·国内外研究现状第13-14页
   ·本文的主要内容第14-15页
第二章 文本分类的概念和向量空间模型第15-26页
   ·文本分类的概念第15-18页
     ·现代文本分类的基础理论—机器学习第15-16页
     ·文本分类的定义第16-18页
   ·向量空间模型第18-20页
   ·分类系统的性能评价第20-22页
     ·常用的评估参数介绍第20-22页
     ·其他一些评估参数介绍第22页
   ·粗糙集理论第22-25页
     ·粗糙集的基本概念第22-24页
     ·决策表的离散化第24-25页
   ·将粗糙集理论用于文本分类的可行性分析第25-26页
第三章 文本分类系统中关键技术问题第26-46页
   ·系统总体框架第26页
   ·文本的预处理第26-27页
     ·文本预处理方法第26-27页
     ·基于词性选择的文本预处理第27页
   ·特征选择方法第27-31页
     ·文档频率第27-28页
     ·互信息第28页
     ·信息增益第28-29页
     ·期望交叉熵第29-30页
     ·文本证据权(WET)第30页
     ·基于互信息改扩展的特征选择方法(EMI)第30-31页
       ·互信息(MI)存在的不足第30-31页
       ·构造思想第31页
   ·特征项权重公式第31-33页
     ·布尔权重第32页
     ·词频权重第32页
     ·TF-IDF权重第32-33页
   ·文本分类方法第33-39页
     ·朴素贝叶斯分类法(NB)第33-34页
     ·K-邻近算法第34-35页
     ·支持向量机算法第35-39页
       ·支持向量机线性可分模式的最优超平面构造第36-37页
       ·支持向量机线性不可分模式的最优超平面构造第37-38页
       ·常用核函数介绍第38-39页
   ·分类方法对比研究第39-40页
     ·几种方法的比较第39-40页
   ·实验系统的各项参数第40页
   ·实验用语料库第40-41页
   ·实验结果与分析第41-46页
第四章 基于粗糙集属性约简的特征选择方法第46-51页
   ·基于粗糙集属性约简的特征选择方法第46-49页
     ·文本预处理第46页
     ·决策表的建立第46-47页
     ·决策表的离散化第47页
     ·基于属性重要度的条件属性约简第47-49页
     ·特征的选择第49页
   ·实验结果及其分析第49-51页
第五章 中文文本自动分类工具的设计与实现第51-57页
   ·分类工具的体系结构第51-54页
   ·主要功能模块介绍第54-57页
     ·文本处理及特征选择模块第54-55页
     ·文本分类模块第55-56页
     ·分类测试与结果评估模块第56-57页
第六章 总结与展望第57-59页
   ·本文主要工作和创新点第57页
   ·不足及对未来的展望第57-59页
参考文献第59-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:建立树形结构的英蒙汉电子词典及其加密算法的研究
下一篇:蒙文CMS系统的研究与实现