首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于改进型特征选择算法的文本分类方法研究

摘要第6-7页
Abstract第7页
第一章 绪论第9-12页
    1.1 研究背景及意义第9页
    1.2 当前研究中存在的不足第9-10页
    1.3 研究内容及创新点第10-11页
    1.4 论文组织架构第11-12页
第二章 文本分类相关研究第12-24页
    2.1 文本分类概述第12-14页
    2.2 特征选择算法第14-17页
        2.2.1 卡方检测CHI第14-15页
        2.2.2 信息增益IG第15-16页
        2.2.3 互信息MI第16页
        2.2.4 区分度特征选择DFS第16-17页
    2.3 特征加权算法第17-20页
        2.3.1 TF-IDF算法第18-19页
        2.3.2 TEF-WA算法第19-20页
    2.4 文本分类算法第20-23页
        2.4.1 支持向量机第20-21页
        2.4.2 人工神经网络第21-22页
        2.4.3 朴素贝叶斯第22-23页
    2.5 小结第23-24页
第三章 基于特征词两面性的DFS-sCHI特征选择算法第24-35页
    3.1 引言第24页
    3.2 DFS-sCHI算法思想及步骤第24-25页
    3.3 DFS-sCHI算法详细说明第25-29页
        3.3.1 基于DFS评分的相关性计算第25-27页
        3.3.2 基于CHI评分的相关性计算第27页
        3.3.3 基于CHI因子的正负相关性计算第27-28页
        3.3.4 特征词筛选策略第28-29页
    3.4 实验及结果分析第29-34页
        3.4.1 数据集第29-30页
        3.4.2 评价标准第30-31页
        3.4.3 均衡数据集下DFS与DFS-sCHI对比实验第31-32页
        3.4.4 不平衡数据下DFS与DFS-sCHI对比实验第32-34页
    3.5 小结第34-35页
第四章 基于DFS的TF-pDFS特征加权算法第35-43页
    4.1 引言第35页
    4.2 算法思想及步骤第35-38页
        4.2.1 基于DFS因子的类别相关性计算第35-36页
        4.2.2 基于不平衡数据集的类别修正因子策略第36-37页
        4.2.3 TF-pDFS特征加权算法第37-38页
    4.3 实验及结果分析第38-42页
        4.3.1 数据集第38页
        4.3.2 评价指标第38-39页
        4.3.3 均衡数据集下TF-IDF、TF-DFS、TF-pDFS对比实验第39-40页
        4.3.4 不平衡数据集下TF-IDF、TF-DFS、TF-pDFS对比实验第40-42页
    4.4 小结第42-43页
第五章 原型系统设计与实现第43-51页
    5.1 系统整体设计第43-44页
        5.1.1 系统功能结构第43-44页
        5.1.2 系统分类流程第44页
    5.2 系统功能展示第44-50页
    5.3 小结第50-51页
第六章 总结与展望第51-52页
    6.1 总结第51页
    6.2 展望第51-52页
参考文献第52-55页
攻读硕士学位期间的主要工作第55-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:混合云环境下前向安全数据加密和完整性审计机制研究
下一篇:基于TrustZone的多任务多用户安全研究与设计