首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于词向量的短文本主题建模研究

摘要第4-5页
Abstract第5页
1 绪论第8-12页
    1.1 研究背景第8页
    1.2 国内外研究现状与发展趋势第8-9页
    1.3 研究目标及意义第9-11页
    1.4 文章结构第11-12页
2 相关工作第12-16页
    2.1 常规文档上的主题模型第12页
    2.2 适用于短文本的主题模型第12-14页
    2.3 结合词向量的短文本主题模型第14-16页
3 相关研究技术与理论基础第16-32页
    3.1 文本预处理第16-17页
        3.1.1 收集数据第16页
        3.1.2 预处理第16-17页
    3.2 Lucene信息检索包第17-21页
        3.2.1 创建索引第19-20页
        3.2.2 搜索过程第20-21页
    3.3 LDA主题模型第21-24页
        3.3.1 核心方法介绍第21-23页
        3.3.2 参数估计第23-24页
    3.4 BTM基于二元组的主题建模技术第24-27页
        3.4.1 二元组抽取第25页
        3.4.2 BTM模型算法介绍第25-26页
        3.4.3 BTM模型的特点第26-27页
    3.5 词嵌入技术第27-32页
        3.5.1 神经网络语言模型第27-28页
        3.5.2 词嵌入第28-29页
        3.5.3 word2vec工具第29-32页
4 狄利克雷多项式模型扩展第32-42页
    4.1 狄利克雷多项式模型第32-33页
    4.2 基于词嵌入的辅助知识第33-34页
    4.3 利用GPU模型引入词嵌入第34-42页
        4.3.1 一般化波利亚罐子模型第34-36页
        4.3.2 单词过滤第36-37页
        4.3.3 模型推导第37-39页
        4.3.4 模型复杂度第39-42页
5 实验第42-54页
    5.1 数据集第42-43页
        5.1.1 百度知道标题第42页
        5.1.2 搜索引擎摘要第42-43页
    5.2 实验设置第43-45页
        5.2.1 词嵌入设置第43-44页
        5.2.2 模型以及参数设置第44-45页
    5.3 主题一致性实验第45-46页
    5.4 短文本分类实验第46-51页
        5.4.1 文档主题分布推导第47-49页
        5.4.2 文档分类准确率第49-50页
        5.4.3 波利亚罐子模型促进量¨的影响第50-51页
    5.5 模型效率第51-54页
6 总结与未来工作第54-56页
    6.1 工作总结第54页
    6.2 未来工作第54-56页
参考文献第56-60页
攻读硕士学位期间学术成果第60-61页
致谢第61-62页

论文共62页,点击 下载论文
上一篇:继承与发展--黄秋园对南派山水画中密体山水形式的影响
下一篇:浅议近代北派山水中构图对雄浑意境的营造