首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于FastText的长文本快速精确分类算法研究

摘要第4-6页
Abstract第6-7页
第1章 绪论第12-20页
    1.1 研究背景及意义第12-15页
    1.2 国内外研究现状第15-18页
        1.2.1 文本表示研究现状第15-16页
        1.2.2 文本分类的研究现状第16-18页
    1.3 论文主要研究内容第18页
    1.4 论文的总体框架第18-19页
    1.5 本章小结第19-20页
第2章 文本表示方法和分类方法概述第20-34页
    2.1 小说文本数据的预处理第20-22页
    2.2 特征提取方法第22-25页
        2.2.1 词袋模型第22页
        2.2.2 TF-DF算法第22-23页
        2.2.3 BM25算法第23-25页
        2.2.4 词向量的分布式表示第25页
    2.3 分类方法综述第25-32页
        2.3.1 随机森林算法第25-26页
        2.3.2 K最近邻算法第26-27页
        2.3.3 支持向量机算法第27-29页
        2.3.4 朴素贝叶斯算法第29-31页
        2.3.5 FastText算法第31-32页
    2.4 本章小结第32-34页
第3章 长文本分类模型第34-44页
    3.1 文本的特征提取第34-37页
        3.1.1 基于BM25的小说进行关键词的提取第34页
        3.1.2 基于小说关键词的关键语句块提取算法第34-37页
        3.1.3 基于FastText的词向量提取第37页
    3.2 基于关键语句块的FastText分类模型第37-39页
    3.3 基于朴素贝叶斯算法的纠错器第39-41页
    3.4 基于FastText的长文本快速精确分类模型第41-43页
    3.5 本章小结第43-44页
第4章 实验结果与分析第44-59页
    4.1 实验环境与实验数据分析第44-45页
        4.1.1 实验环境分析第44页
        4.1.2 实验数据分析第44-45页
    4.2 实验总体简介第45-46页
        4.2.1 预处理阶段实验介绍第46页
        4.2.2 训练阶段实验介绍第46页
    4.3 基于传统机器学习算法的文本分类实验第46-52页
        4.3.1 对题目分类的实验与分析第47-50页
        4.3.2 基于BM25特征的长文本分类实验第50-52页
    4.4 基于关键语句块特征的长文本分类实验第52-58页
        4.4.1 各参数的调校与实验结果的分析第53-57页
        4.4.2 本算法与传统方法的分析与比较第57-58页
    4.5 基于FastText的长文本快速精确分类模型分类实验第58页
    4.6 本章小结第58-59页
第5章 总结与展望第59-61页
    5.1 总结第59-60页
    5.2 展望第60-61页
参考文献第61-64页
攻读硕士学位期间主要的研究成果第64-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:微视频资源与高中生物教学有效结合的研究
下一篇:基于WSN数据融合的安全保护策略研究