首页--社会科学总论论文--管理学论文--管理技术与方法论文

文本向量化方法对文本分类效果影响的改进研究

摘要第5-6页
abstract第6页
第1章 绪论第9-15页
    1.1 研究背景及意义第9-10页
    1.2 国内外研究发展及现状第10-12页
        1.2.1 国内外文本分类研究发展历程第10-11页
        1.2.2 国内外文本分类研究现状第11-12页
        1.2.3 文献评述第12页
    1.3 本文的主要工作和创新第12-13页
    1.4 本文的组织结构第13-15页
第2章 文本分类流程概述第15-21页
    2.1 文本分类概述第15-16页
    2.2 文本预处理第16-17页
        2.2.1 文本分词第16页
        2.2.2 去停用词第16-17页
    2.3 文本表示模型第17页
    2.4 特征选择第17-18页
        2.4.1 嵌入式特征选择(Embedded)第17页
        2.4.2 封装式特征选择(Wrapper)第17-18页
        2.4.3 过滤式特征选择(Filtering)第18页
    2.5 文本分类算法第18-19页
        2.5.1 生成模型第19页
        2.5.2 判别模型第19页
    2.6 分类性能评估第19-21页
第3章 文本向量化方法的改进第21-30页
    3.1 基准文本向量化算法介绍第21-22页
        3.1.1 word2vec算法第21-22页
        3.1.2 基准文本向量化方法第22页
        3.1.3 word2vec的不足第22页
    3.2 textrank加权词向量算法第22-24页
        3.2.1 词向量加权第23页
        3.2.2 textrank介绍第23-24页
        3.2.3 textrank加权词向量算法第24页
    3.3 主题-textrank加权词向量算法第24-28页
        3.3.1 特征拼接第24-25页
        3.3.2 LDA主题模型第25-26页
        3.3.3 主题-textrank加权词向量算法第26-28页
    3.4 主题-tfidf加权词向量算法第28-30页
        3.4.1 TF-IDF第28页
        3.4.2 主题-tfidf加权词向量算法第28-30页
第4章 实验设计及结果分析第30-44页
    4.1 实验方案设计第30-33页
        4.1.1 实验数据集介绍第30-31页
        4.1.2 word2vec参数设置第31-32页
        4.1.3 LDA主题模型参数设置第32页
        4.1.4 textrank参数设置第32-33页
        4.1.5 分类及特征筛选模型的选择第33页
    4.2 实验设计总流程第33-34页
    4.3 分类模型及分类结果展示第34-37页
        4.3.1 决策树原理及分类结果展示第34页
        4.3.2 朴素贝叶斯原理及分类结果展示第34-35页
        4.3.3 逻辑斯蒂回归原理及分类结果展示第35-36页
        4.3.4 K-近邻法原理及分类结果展示第36-37页
    4.4 分类结果分析第37-42页
        4.4.1 各类别分类结果可视化及比较第37-39页
        4.4.2 总体分类结果可视化及比较第39-42页
    4.5 实验总结及问题分析第42-44页
总结与展望第44-46页
    本文工作总结第44页
    下一步工作展望第44-46页
参考文献第46-48页
附录A 网络爬虫代码第48-50页
致谢第50-51页

论文共51页,点击 下载论文
上一篇:生鲜电商O2O模式网络营销研究--以"盒马鲜生"为例
下一篇:郑洛新国家自主创新示范区智库联盟建设研究