首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于词向量的短文本聚类研究与应用

摘要第2-3页
Abstract第3页
1 绪论第6-12页
    1.1 研究背景第6-8页
    1.2 国内外研究现状第8-9页
    1.3 本文工作第9-10页
    1.4 本文组织结构第10-12页
2 相关技术第12-21页
    2.1 网络爬虫第12-14页
    2.2 文本建模第14-17页
        2.2.1 向量空间模型第14-15页
        2.2.2 浅层语义分析模型第15-16页
        2.2.3 文档主题模型第16-17页
        2.2.4 词对主题模型第17页
    2.3 相似度计算第17-19页
        2.3.1 欧氏距离第18页
        2.3.2 夹角余弦距离第18页
        2.3.3 闵可夫斯基距离第18-19页
    2.4 聚类分析第19-21页
        2.4.1 聚类算法第19-20页
        2.4.2 聚类评价第20-21页
3 基于词向量和EMD距离的短文本聚类第21-32页
    3.1 问题引出第21页
    3.2 算法描述第21-28页
        3.2.1 词向量第22-24页
        3.2.2 短文本相似度计算第24-27页
        3.2.3 算法流程第27-28页
    3.3 实验结果与分析第28-31页
        3.3.1 不同文本表示对聚类结果的影响第28-30页
        3.3.2 不同距离度量对聚类结果的影响第30-31页
    3.4 本章小结第31-32页
4 基于词向量与密度峰值发现的论文标题聚类第32-50页
    4.1 问题引出第32页
    4.2 数据的采集与处理第32-36页
        4.2.1 数据来源第32-33页
        4.2.2 数据采集第33-36页
    4.3 算法描述第36-43页
        4.3.1 词向量的训练第36-38页
        4.3.2 论文标题的文本表示第38-39页
        4.3.3 论文标题的相似度计算第39页
        4.3.4 基于密度峰值发现的论文标题聚类第39-43页
    4.4 实验设计及分析第43-49页
        4.4.1 词向量训练语料对于聚类结果的影响第44-46页
        4.4.2 截断距离的选取对于聚类结果的影响第46页
        4.4.3 不同聚类算法的对比实验第46-49页
    4.5 本章小结第49-50页
结论第50-51页
参考文献第51-54页
攻读硕士学位期间发表学术论文情况第54-55页
致谢第55-57页

论文共57页,点击 下载论文
上一篇:面向云计算的仿真系统体系结构及关键技术研究
下一篇:基于方向场与模式的四边形网格生成算法