首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于VSM模型和特征选择算法的中文文本自动分类研究

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-14页
   ·研究文本自动分类的背景和意义第9-10页
   ·国内外研究现状综述第10-12页
     ·特征选择算法的研究现状第10-11页
     ·文本自动分类的研究现状第11-12页
   ·本文的研究目标和主要内容第12-13页
   ·本文组织结构第13-14页
第2章 文本分类研究综述第14-26页
   ·文本分类基本概念第14-15页
     ·文本分类的定义第14页
     ·文本分类的流程第14-15页
   ·文本表示综述第15-18页
     ·向量空间模型(VSM)第16-17页
       ·tf-idf 权重第16-17页
       ·词频权重(TF)第17页
       ·熵权重第17页
     ·布尔模型第17页
     ·概率模型第17-18页
   ·特征选择算法研究综述第18-20页
     ·文档频率方法(DF)第18页
     ·信息增益方法(Information Gain,IG)第18-19页
     ·卡方统计量方法(CHI-square)第19-20页
     ·期望交叉熵(Expected Cross Entropy,ECE)第20页
   ·文本分类算法研究综述第20-25页
     ·基于实例的KNN 分类算法第20-21页
     ·基于Rocchio 的分类算法第21-22页
     ·基于统计的贝叶斯分类算法第22页
     ·基于决策树的分类算法第22-23页
     ·基于神经网络的分类算法第23页
     ·基于支持向量机的分类算法第23-25页
   ·本章小结第25-26页
第3章 基于 tf-idf 的改进互信息算法和比例区分度 CPD 算法第26-35页
   ·改进的 tf-idf 权重方法第26-27页
   ·传统的互信息算法第27-30页
   ·基于互信息的特征选择方法研究第30-32页
     ·改进的互信息的特征选择算法第30-31页
     ·结合改进的 tf-idf 的 DMI 算法的文本分类方法第31-32页
   ·基于比例区分度(CPD)的特征选择算法第32-33页
   ·本章小结第33-35页
第4章 基于VSM 的中文文本分类系统的设计第35-43页
   ·系统设计目标第35页
   ·文本分类系统框架第35-36页
   ·中文文本预处理第36-40页
   ·特征选择第40页
   ·文本分类第40-41页
   ·文本分类器的评价第41-42页
     ·精确率(Precision)和召回率(Recall)第41-42页
     ·微平均和宏平均第42页
   ·本章小结第42-43页
第5章 中文文本分类实验测试及结果分析第43-49页
   ·实验环境和实验目的第43页
   ·实验语料第43-44页
   ·实验结果及结果分析第44-48页
     ·基于VSM 模型的DMI 算法的实验结果分析第44-46页
     ·基于VSM 模型的CPD 的实验结果分析第46-47页
     ·tf-idf 和改进后的tf-idf 的实验结果分析第47-48页
   ·本章小结第48-49页
结论第49-51页
参考文献第51-54页
附录第54-55页
致谢第55-56页
在读期间公开发表论文(著)及科研情况第56页

论文共56页,点击 下载论文
上一篇:基于用户—项目的混合协同过滤技术的应用研究
下一篇:基于M-Agent的分布式数据挖掘研究