首页--社会科学总论论文--统计学论文--统计方法论文

基于快速文本分类器与不平衡数据的研究

摘要第3-4页
abstract第4页
1.绪论第7-14页
    1.1 研究背景第7页
    1.2 研究目的与意义第7-9页
    1.3 不平衡分类问题国内外研究成果第9-12页
        1.3.1 数据采样的方法第9-11页
        1.3.2 算法层次的方法第11-12页
    1.4 算法设计路线以及思路第12-13页
    1.5 本文创新之处第13-14页
2.不平衡情感文本的处理以及评价方式第14-19页
    2.1 常见情感文本第14-15页
    2.2 情感文本分类第15-16页
        2.2.1 情感极性信息第15-16页
        2.2.2 多类别情感信息第16页
    2.3 不平衡数据的处理方式第16-17页
        2.3.1 数据采样第16-17页
        2.3.2 集成学习第17页
    2.4 分类评价第17-19页
3.基于FastText算法的改进策略第19-22页
    3.1 原始FastText算法第19-20页
    3.2 基于平衡数据的FastText算法第20-21页
    3.3 基于等比例Bootstrap的FastText算法第21页
    3.4 基于不等比例Bootstrap的FastText算法第21-22页
4.实证分析第22-35页
    4.1 数据说明第22-25页
    4.2 数据的预处理第25-26页
        4.2.1 异常数据的处理第25页
        4.2.2 分词第25-26页
        4.2.3 停用词第26页
        4.2.4 提取表情以及主题第26页
    4.3 模型设计第26-28页
    4.4 参数调优第28-30页
        4.4.1 分类器数量第28-29页
        4.4.2 Bootstrap不等比例欠采样的比例波动第29-30页
    4.5 模型结果第30-35页
        4.5.1 原始FastText算法结果第30-31页
        4.5.2 基于平衡数据的FastText算法结果第31-32页
        4.5.3 基于等比例Bootstrap的FastText算法结果第32-33页
        4.5.4 基于不等比例Bootstrap的FastText算法结果第33-35页
5.结论和改进第35-36页
参考文献第36-38页
附录第38-45页
致谢第45页

论文共45页,点击 下载论文
上一篇:企业社会工作介入劳动争议调解工作的研究
下一篇:关系赋权视角下缓解晚期肺癌患者及家属焦虑感的个案研究