首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于集成学习的英文文本分类算法研究

摘要第4-6页
abstract第6-7页
第1章 绪论第11-16页
    1.1 文本分类研究背景与发展历史第11-13页
        1.1.1 研究背景第11-12页
        1.1.2 国内外文本分类研究历史及现状第12-13页
    1.2 研究意义第13-14页
    1.3 本文主要研究工作第14-15页
    1.4 本文组织结构第15-16页
第2章 文本分类相关技术总结第16-27页
    2.1 文本预处理第16-17页
        2.1.1 分词第16-17页
        2.1.2 去停用词第17页
    2.2 文本表示第17-21页
        2.2.1 特征选择第17-20页
        2.2.2 相似度计算第20-21页
    2.3 文本表示模型第21-22页
        2.3.1 基于集合论的模型第21页
        2.3.2 基于代数论的模型第21-22页
        2.3.3 概率检索的模型第22页
    2.4 常用的文本分类算法介绍第22-25页
        2.4.1 朴素贝叶斯第22-23页
        2.4.2 支持向量机算法第23页
        2.4.3 K最近邻算法第23-24页
        2.4.4 神经网络第24-25页
    2.5 评价方法第25-26页
    2.6 本章总结第26-27页
第3章 集成学习在英文文本分类中的应用及优化第27-41页
    3.1 Bagging算法介绍及优化第28-33页
        3.1.1 Bagging算法原理介绍及实现流程第28-29页
        3.1.2 随机森林算法介绍第29-31页
        3.1.3 随机森林优化算法OOB-WRF第31-33页
    3.2 Boosting算法介绍及其优化第33-40页
        3.2.1 Boosting算法介绍第33页
        3.2.2 AdaBoost算法介绍第33-35页
        3.2.3 Ada-NB算法第35-37页
        3.2.4 修正类别词频的贝叶斯文本分类算法Ada-RCFNB第37-40页
    3.3 本章小结第40-41页
第4章 实验设计与结果分析第41-50页
    4.1 实验设计概要第41页
    4.2 实验环境和数据集第41-43页
        4.2.1 实验环境第41-43页
        4.2.2 数据集第43页
    4.3 对比实验第43-49页
        4.3.1 常用文本分类算法对比实验第43-45页
        4.3.2 C4.5、RF、OOB-WRF对比实验第45-46页
        4.3.3 NB、RCFNB、Ada-RCFNB对比实验第46-49页
    4.4 本章小结第49-50页
第5章 总结与展望第50-52页
    5.1 全文总结第50-51页
    5.2 工作展望第51-52页
参考文献第52-55页
作者简介及科研成果第55-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:基于深度学习和时间上下文的推荐算法研究
下一篇:虹膜识别关键问题的研究与实现