首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于LDA模型的文本聚类研究

摘要第1-6页
ABSTRACT第6-9页
第1章 绪论第9-11页
   ·研究背景及选题意义第9-10页
   ·本文主要工作第10页
   ·论文组织架构第10-11页
第2章 相关理论与关键技术第11-25页
   ·文本预处理第11-14页
   ·文本建模第14-16页
   ·特征提取第16-19页
     ·文档频率(DF)第16页
     ·互信息(MI)第16-17页
     ·信息增益(IG)第17页
     ·X~2统计(CHI)第17-18页
     ·特征增强(TS)第18页
     ·期望交叉熵(ECE)第18-19页
   ·文本聚类算法第19-24页
     ·基于划分的聚类算法第19页
     ·基于层次的聚类算法第19-20页
     ·基于模型的聚类算法第20-21页
     ·基于密度的聚类算法第21-22页
     ·基于蚁群的聚类算法第22-23页
     ·基于网格的聚类算法第23页
     ·基于模糊的聚类算法第23-24页
   ·聚簇主题识别第24页
   ·本章小结第24-25页
第3章 基于LDA模型的文本聚类第25-37页
   ·相关统计模型简介第25-28页
     ·VSM模型第25-26页
     ·一元混合模型第26页
     ·LSI模型第26-27页
     ·PLSI模型第27-28页
   ·基于LDA模型的文本聚类第28-34页
     ·LDA主题模型第28-30页
     ·最优主题数T选择第30-31页
     ·参数估计第31-32页
     ·基于LDA的文本相似度计算第32-34页
   ·聚类有效性评价标准第34-36页
   ·本章小结第36-37页
第4章 基于LDA模型的聚簇主题识别第37-42页
   ·聚簇主题识别方法简介第37-38页
   ·主题识别的要求第38页
   ·主题识别的评价方法第38-39页
   ·基于LDA模型的聚簇主题识别第39-41页
   ·本章小结第41-42页
第5章 实验设计及结果分析第42-52页
   ·实验语料选择第42页
   ·实验平台搭建第42-46页
     ·实验环境第42页
     ·LDA建模平台搭建第42-46页
   ·实验结果与分析第46-51页
     ·文本聚类结果及分析第46-49页
     ·聚簇主题识别结果及分析第49-51页
   ·本章小结第51-52页
第6章 总结与展望第52-54页
   ·全文总结第52页
   ·研究展望第52-54页
参考文献第54-58页
硕士期间发表的论文及参与的项目第58-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:基于在线评论知识挖掘的模糊领域本体构造及其应用研究
下一篇:基于中文维基百科的概念相关词群研究