首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语义的短文本聚类算法研究

致谢第1-5页
摘要第5-6页
Abstract第6-9页
1 绪论第9-16页
   ·课题的研究背景第9-10页
   ·课题研究的目的及意义第10页
   ·国内外研究现状第10-12页
   ·课题的研究内容第12-14页
   ·论文结构第14页
   ·小结第14-16页
2 相关技术介绍第16-28页
   ·文本聚类概述第16-17页
   ·文本建模及相似度计算第17-21页
     ·空间向量模型第17-18页
     ·基于空间向量模型的文本相似度计算第18-19页
     ·基于概率统计的LDA模型第19-21页
     ·基于LDA模型的文本相似度计算第21页
   ·基于知网的中文语义相似度计算第21-23页
   ·频繁项集挖掘算法第23-26页
     ·关联规则第23-24页
     ·串行Aprior关联规则挖掘算法第24-25页
     ·串行Fp-growth关联规则挖掘算法第25-26页
   ·聚类效果评价第26-27页
   ·本章小结第27-28页
3 基于语义的短文本聚类算法第28-44页
   ·短文本表示第28-29页
   ·短文本之间的语义相似度第29-32页
     ·词语语义相似度计算第30页
     ·短文本之间语义相似度计算第30-32页
   ·基于频繁项集挖掘短文集主题分布第32-35页
     ·基于频繁项集的挖掘潜在主题第32-33页
     ·基于频繁项集挖掘聚类中心第33-35页
   ·并行频繁项集挖掘第35-42页
     ·MapReduce编程框架第36-37页
     ·基于MapReduce编程框架改进的并行频繁项集挖掘第37-40页
     ·并行频繁项集挖掘算法复杂度分析第40-42页
   ·短文本聚类方法的总体实现流程第42页
   ·本章小结第42-44页
4 试验效果及评价第44-56页
   ·短文本聚类实验第44-51页
     ·数据准备第44页
     ·评价标准第44-45页
     ·参数选取第45-46页
     ·聚类中心对比试验第46-48页
     ·文本聚类对比试验分析第48-51页
   ·频繁项集挖掘效率试验第51-55页
     ·单机对比试验第51-53页
     ·集群试验环境第53页
     ·集群扩展性和加速比实验第53-55页
   ·本章小结第55-56页
结论第56-58页
参考文献第58-61页
作者简历第61-63页
学位论文数据集第63页

论文共63页,点击 下载论文
上一篇:水印图像的压缩感知算法研究
下一篇:基于面状区域混合类型数据的空间聚类算法研究及应用