首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于不均衡数据集的文本分类算法研究

摘要第1-4页
ABSTRACT第4-8页
1 绪论第8-14页
   ·论文研究背景和意义第8-9页
   ·国内外研究现状第9-13页
   ·本文的研究内容和章节结构第13-14页
2 文本分类相关技术第14-23页
   ·文本分类定义和过程第14-15页
     ·文本分类的定义第14页
     ·文本分类基本过程第14-15页
   ·文本表示模型第15-18页
     ·文本预处理技术第16-17页
     ·向量空间模型第17-18页
   ·特征选择技术分析第18-20页
     ·文档频(DF)第18页
     ·CHI 统计量第18-19页
     ·信息增益(IG)第19页
     ·互信息(MI)第19-20页
   ·常用文本分类算法第20-22页
     ·简单向量距离算法第20-21页
     ·Na ve Bayes 算法第21页
     ·KNN 算法第21-22页
   ·本章小结第22-23页
3 不均衡数据处理方法研究第23-31页
   ·数据集不均衡问题的提出第23-24页
   ·数据不均衡问题解决方法第24-30页
     ·基于重采样技术的不均衡数据处理算法研究第24-27页
     ·基于不均衡文本数据集的改进特征选择方法第27-28页
     ·基于分类器的改进算法第28-30页
   ·本章小结第30-31页
4 组合的不均衡数据集上文本分类方法第31-48页
   ·一种针对不均衡数据集的改进 CHI 特征选择方法第31-36页
     ·传统 CHI 统计特征选择方法的研究第31-32页
     ·相关改进算法描述第32-34页
     ·不均衡数据集上 CHI 特征选择方法第34-36页
   ·数据层上的不均衡数据重采样算法第36-41页
     ·随机上采样和随机下采样的组合采样方法第36-37页
     ·SMOTE 上采样方法结合基于改进聚类下采样的算法研究第37-41页
   ·实验结果分析第41-48页
     ·语料集第41-42页
     ·实验平台简介第42-43页
     ·评价指标第43-44页
     ·实验结果第44-48页
5 总结与展望第48-50页
   ·工作总结第48-49页
   ·未来工作展望第49-50页
致谢第50-51页
参考文献第51-55页
附录第55页
 A 作者在攻读学位期间发表的论文目录第55页

论文共55页,点击 下载论文
上一篇:基于本体和属性攻击图的渗透测试模型研究与系统实现
下一篇:用于CT序列图像的体积和表面积分段旋转测量方法