首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于主题模型的话题聚类算法的研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-14页
    1.3 研究内容与论文结构第14-16页
第二章 文本处理知识与聚类关键技术第16-26页
    2.1 微博平台特征分析第16-17页
    2.2 微博数据文本预处理第17-19页
        2.2.1 中文分词和词性标注第17-18页
        2.2.2 微博噪声处理第18-19页
    2.3 文本模型表示第19-21页
        2.3.1 向量空间模型(VSM)第19页
        2.3.2 潜在语义分析模型(LSA)第19-20页
        2.3.3 概率潜在语义分析模型(PLSA)第20页
        2.3.4 潜在狄利克雷分布模型(LDA)第20-21页
        2.3.5 词对主题模型(BTM)第21页
    2.4 文本相似度度量第21-22页
    2.5 文本聚类算法第22-23页
    2.6 本章小结第23-26页
第三章 基于主题模型的微博热点话题发现第26-38页
    3.1 基于主题模型的文本表示第26-30页
        3.1.1 传统文本模型的问题第26-27页
        3.1.2 LDA主题模型第27-28页
        3.1.3 BTM主题模型第28-30页
    3.2 实验设计与结果分析第30-37页
        3.2.1 主题模型的比较第30-31页
        3.2.2 主题个数的确定第31-34页
        3.2.3 最佳主题的选取第34-36页
        3.2.4 实验结果第36-37页
    3.3 本章小结第37-38页
第四章 基于word2vec相似度计算的聚类算法研究第38-54页
    4.1 基于word2vec的词向量表示第38-44页
        4.1.1 word2vec词向量第38-39页
        4.1.2 神经网络语言模型第39-44页
    4.2 基于稠密特征的word2vec相似度计算第44-48页
        4.2.1 基于word2vec的相似度计算第44-45页
        4.2.2 基于稠密特征的文档-主题相似度计算第45-48页
    4.3 实验设计与结果分析第48-52页
    4.4 本章小结第52-54页
第五章 系统的设计与实现第54-64页
    5.1 系统架构设计第54-55页
    5.2 关键模块实现第55-63页
        5.2.1 文本预处理模块第55-58页
        5.2.2 主题发现模块第58-59页
        5.2.3 文本聚类模块第59-63页
    5.3 本章小结第63-64页
第六章 总结与展望第64-66页
参考文献第66-70页
致谢第70-72页
攻读学位期间发表的学术论文目录第72页

论文共72页,点击 下载论文
上一篇:SDN网络中DDoS放大攻击的防御机制研究
下一篇:内容中心网缓存策略研究