首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本特征选择算法的研究

摘要第4-5页
Abstract第5-6页
目录第7-9页
1 绪论第9-12页
    1.1 研究背景及意义第9页
    1.2 研究现状第9-11页
    1.3 论文的结构安排第11-12页
2 文本分类技术简介第12-23页
    2.1 基本概念第12页
    2.2 文本分类流程的介绍第12-18页
        2.2.1 文本语料库概述第12-13页
        2.2.2 文本预处理第13页
        2.2.3 文本表示第13-14页
        2.2.4 特征降维第14页
        2.2.5 构造分类器第14-17页
        2.2.6 测评第17-18页
    2.3 常用的特征选择方法第18-22页
        2.3.1 文档频率(DF)第18-19页
        2.3.2 互信息(MI)第19页
        2.3.3 信息增益(IG)第19-20页
        2.3.4 χ~2统计量(Chi)第20-21页
        2.3.5 ReliefF算法第21-22页
    2.4 本章小结第22-23页
3 基于特征权重与词间相关性的文本特征选择算法第23-29页
    3.1 RelifF算法分析第23页
    3.2 特征选择算法——mRMR-ReliefF第23-27页
        3.2.1 基于概率差值改进ReliefF算法第23-25页
        3.2.2 基于词间相关性的冗余处理第25-26页
        3.2.3 mRMR-ReliefF算法描述第26-27页
    3.3 实验过程第27-29页
        3.3.1 实验结果及分析第27-28页
        3.3.2 小结第28-29页
4 基于信息增益的文本特征选择方法第29-37页
    4.1 信息增益算法分析第29页
    4.2 改进信息增益算法第29-33页
        4.2.1 不均衡数据集的处理第29-30页
        4.2.2 低频特征的处理第30-31页
        4.2.3 高频冗余特征的处理第31-33页
        4.2.4 TDpIG算法描述第33页
    4.3 实验过程第33-37页
        4.3.1 实验结果及分析第33-36页
        4.3.2 小结第36-37页
结论第37-39页
参考文献第39-42页
攻读硕士学位期间发表学术论文情况第42-43页
致谢第43页

论文共43页,点击 下载论文
上一篇:事务间关联规则挖掘技术研究
下一篇:辽宁省女子曲棍球项目后备人才培养现状研究