首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

一种基于统计流形学习的文本分类算法

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第14-20页
    1.1 文本分类问题简述第14-15页
    1.2 研究背景第15-17页
    1.3 研究内容与方法第17页
    1.4 本文结构第17-20页
第二章 文本分类算法第20-30页
    2.1 基于统计的文本分类算法第20-22页
        2.1.1 TF-IDF第20-21页
        2.1.2 BM25 Okapi第21页
        2.1.3 朴素贝叶斯进行文本分类第21-22页
    2.2 基于语义相似度的文本分类算法第22-24页
        2.2.1 概率隐语义分析PLSA第22-23页
        2.2.2 从PLSA到LDA第23-24页
    2.3 基于深度学习的文本分类算法第24-28页
        2.3.1 卷积神经网络第25-26页
        2.3.2 循环神经网络第26-27页
        2.3.3 循环卷积神经网络第27-28页
    2.4 本章小结第28-30页
第三章 基于主题多样性分布的文本概率模型第30-38页
    3.1 词向量简介第30-34页
    3.2 主题多样性分布第34-35页
    3.3 不同主题权值系数下的的文本概率模型第35-36页
    3.4 本章小结第36-38页
第四章 基于统计流形学习的概率模型度量第38-50页
    4.1 散度距离第38-40页
        4.1.1 K-L散度第38-39页
        4.1.2 J-S散度第39页
        4.1.3 f散度第39-40页
        4.1.4 散度距离的讨论第40页
    4.2 沃瑟斯坦度量第40-41页
        4.2.1 沃瑟斯坦度量的讨论第40-41页
    4.3 L~p空间距离第41-42页
        4.3.1 文本概率模型上的L_1距离和L_2距离第41-42页
    4.4 统计流形学习框架下的文本概率模型度量第42-46页
        4.4.1 统计流形学习第42-45页
        4.4.2 文本概率模型上的统计流形度量方法第45-46页
    4.5 本章小结第46-50页
第五章 实验分析第50-60页
    5.1 文本分类实验第50-55页
        5.1.1 分类实验数据集简介第50-51页
        5.1.2 词向量训练使用语料库简介第51页
        5.1.3 文本分类实验所用对比算法第51-52页
        5.1.4 word2vec训练参数分析与设置第52页
        5.1.5 TCSM主题数量K分析与设置第52-53页
        5.1.6 文本分类实验结果与分析第53-55页
    5.2 主题分布多样性观察实验第55-57页
        5.2.1 主题分布多样性观察实验结果与分析第55-57页
    5.3 文本摘要抽取实验第57-58页
        5.3.1 文本摘要抽取实验所用数据集第57页
        5.3.2 文本摘要抽取实验所用对比算法第57-58页
        5.3.3 文本摘要抽取实验结果与分析第58页
    5.4 本章小结第58-60页
第六章 总结与展望第60-62页
    6.1 总结第60页
    6.2 后续工作第60-62页
参考文献第62-66页
致谢第66-68页
在读期间发表的学术论文与取得的研究成果第68页

论文共68页,点击 下载论文
上一篇:基于冲突选择模型的用户偏好挖掘及活动参与预测研究
下一篇:基于软件定义网络的网络编码框架