首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于BTM的短文本聚类

摘要第1-5页
Abstract第5-7页
目录第7-9页
第一章 绪论第9-15页
   ·短文本聚类的意义和作用第9-10页
   ·国内外研究现状第10-12页
     ·短文本聚类研究现状第10-12页
     ·短文本研究难度及解决方法第12页
   ·本文的主要工作第12-13页
   ·本文的组织结构第13-15页
第二章 相关理论及技术第15-28页
   ·文本的预处理第15-16页
     ·分词技术第15-16页
     ·去停用词第16页
   ·文本聚类第16-22页
     ·文本聚类概述第16-18页
     ·文档的相似度计算第18-19页
     ·对聚类结果的评价第19-21页
     ·聚簇结果描述简介第21-22页
   ·文档模型的表示第22-27页
     ·向量空间模型(VSM)第22-23页
     ·一元混合模型第23-24页
     ·隐性语义索引(LSI)第24-25页
     ·概率隐性语义索引(PLSI)第25页
     ·隐含迪里克雷分布(LDA)第25-27页
     ·词对主题模型(BTM)第27页
   ·本章小结第27-28页
第三章 基于BTM的语义空间分析第28-36页
   ·BTM模型的详细描述第28-31页
   ·BTM参数推理第31-33页
   ·基于BTM语义的文档特征第33-35页
     ·短文本语义的表示形式第33-34页
     ·基于主题特征的短文本表示形式第34-35页
   ·本章小结第35-36页
第四章 基于BTM的短文本聚类第36-45页
   ·基于BTM的短文本聚类框架第36-37页
   ·文本预处理第37-38页
   ·用BTM进行建模第38-39页
   ·短文本表示以及相似度计算第39-41页
     ·短文本向量的表示第39页
     ·TF-IDF权重计算第39-40页
     ·文本相似度计算第40-41页
   ·K-means算法第41-42页
   ·基于BTM的聚簇描述第42-44页
   ·本章小结第44-45页
第五章 实验结果和分析第45-54页
   ·实验语料库的选择第45页
   ·实验环境第45页
   ·实验结果评价标准第45-46页
   ·实验结果与分析第46-53页
     ·主题个数对聚类结果的影响第46-48页
     ·各类别聚类效果的对比第48-50页
     ·聚簇个数对聚类结果的影响第50-52页
     ·聚簇结果描述第52-53页
   ·本章小结第53-54页
第六章 总结与展望第54-55页
参考文献第55-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:开放网络学习环境中的推荐系统研究
下一篇:中文微博的热点话题发现