首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Word2Vec的中文短文本聚类算法研究与应用

摘要第4-6页
abstract第6-7页
第1章 绪论第12-19页
    1.1 课题背景和意义第12-13页
    1.2 国内外研究现状第13-16页
        1.2.1 短文本聚类的研究现状第13-15页
        1.2.2 短文本聚类面临的问题和解决办法第15-16页
    1.3 本文的主要工作第16-17页
    1.4 本文的组织结构第17-18页
    1.5 本章小结第18-19页
第2章 相关技术研究第19-30页
    2.1 文本聚类概述第19-20页
    2.2 文本预处理第20-22页
        2.2.1 分词第20-22页
        2.2.2 去除停用词和符号第22页
    2.3 特征选择第22-24页
    2.4 特征加权第24-25页
    2.5 文本特征项表示模型第25-26页
    2.6 常用聚类方法第26-28页
        2.6.1 层次聚类第27页
        2.6.2 K-Means聚类第27-28页
    2.7 聚类结果评估第28-29页
    2.8 本章小结第29-30页
第3章 词向量模型第30-37页
    3.1 词向量概述第30-31页
    3.2 Word2Vec语言模型第31-32页
    3.3 连续词袋模型(CBOW)第32-33页
    3.4 Skip_gram模型第33-35页
    3.5 模型效果展示第35-36页
    3.6 本章小结第36-37页
第4章 基于Word2Vec的短文本表示模型第37-45页
    4.1 短文本特点分析第37-38页
    4.2 短文本表示模型初步第38-40页
        4.2.1 基于词向量的简单表示文本方法第38-39页
        4.2.2 基于改进的TF-IDF加权短文本表示方法第39-40页
    4.3 多因子融合策略表示模型第40-44页
        4.3.1 基于词性加权的短文本表示第40-41页
        4.3.2 基于情感加权的短文本表示方法第41-43页
        4.3.3 融合策略第43-44页
    4.4 本章小结第44-45页
第5章 基于词向量的距离聚类模型第45-50页
    5.1 常用的距离和相似度度量方法第45-46页
    5.2 RWMD距离第46-47页
    5.3 基于RWMD距离的改进聚类模型第47-49页
    5.4 本章小结第49-50页
第6章 模型应用与实验分析第50-60页
    6.1 实验数据第50-51页
    6.2 模型应用第51-52页
    6.3 评价指标第52页
    6.4 实验对比及分析第52-58页
        6.4.1 WV_PS模型对比实验第53-55页
        6.4.2 关键参数支撑度阈值C_0的对比试验第55-57页
        6.4.3 Word2Vec中window和size的对比实验第57-58页
        6.4.4 不同距离函数的对比试验第58页
    6.5 本章小结第58-60页
结束语第60-62页
参考文献第62-65页
致谢第65-66页
作者简历及攻读学位期间发表的学术论文与研究成果第66页

论文共66页,点击 下载论文
上一篇:基于docker的持续集成及发布平台的设计与实现
下一篇:基于海明距离的相似查找索引算法研究