首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于偏斜数据集的中文文本分类问题的改进特征权重算法研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-15页
   ·本文的研究背景及现实意义第10-11页
   ·文本分类的应用领域第11-12页
   ·国外研究概况第12页
   ·国内研究概况第12-13页
   ·本文所做的主要研究工作第13-14页
   ·本文组织结构第14-15页
第2章 文本分类过程及相关技术第15-33页
   ·文本分类的概念第15-16页
   ·文本分类的过程及相关技术第16页
   ·文本预处理第16-21页
     ·中文分词第17-20页
     ·本文所用的分词系统第20页
     ·去停用词处理第20-21页
   ·文本特征处理第21-25页
     ·特征选择第21-23页
     ·特征抽取第23-25页
   ·文本向量表示第25-27页
   ·常用分类方法第27-31页
   ·分类评估函数第31-32页
   ·本章小结第32-33页
第3章 词语权重计算方法改进第33-44页
   ·传统特征权重算法TFIDF第33-35页
   ·TFIDF 算法分析第35-36页
   ·基于TFIDF 的改进算法第36-41页
     ·TF-IDF-CF 算法第36-37页
     ·TFIDF’算法第37页
     ·BOR-TFIDF 算法第37-38页
     ·TF-IDF-IG 算法第38-39页
     ·TF-IDF-DI 算法第39-41页
   ·基于数据集分布偏斜的TFIDF-DI 改进算法第41-43页
     ·偏斜数据集第41页
     ·对 TFIDF-DI 分析第41-42页
     ·TFIDF-λDI第42-43页
   ·本章小结第43-44页
第4章 实验与分析第44-47页
   ·实验介绍第44-45页
   ·实验结果及分析第45-46页
   ·本章小结第46-47页
第5章 结论与展望第47-49页
   ·本文工作总结第47-48页
   ·下一步工作设想第48-49页
参考文献第49-52页
致谢第52-53页
在学期间公开发表论文及著作情况第53页

论文共53页,点击 下载论文
上一篇:基于SOA的软件项目管理系统的研究与实现
下一篇:Boosting在文本分类中的应用