首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于LDA主题模型的文本聚类研究

摘要第3-4页
Abstract第4页
第一章 引言第7-11页
    1.1 研究的背景第7页
    1.2 研究的意义第7-9页
    1.3 国内外的研究现状第9-10页
    1.4 研究内容及主要工作第10-11页
第二章 文本挖掘的主要技术第11-24页
    2.1 研究的背景第11页
    2.2 文本表示第11-12页
    2.3 文本预处理第12-19页
        2.3.1 文本分词技术第13-15页
        2.3.2 停用词处理第15-16页
        2.3.3 词干化处理第16页
        2.3.4 特征提取与特征权重计算第16-19页
    2.4 R语言文本挖掘的实验第19-24页
        2.4.1 文本预处理第19-21页
        2.4.2 文本挖掘第21-24页
第三章 文本聚类第24-35页
    3.1 文本相似度的度量第24-25页
    3.2 聚类方法第25-28页
    3.3 R语言对新闻数据的分析第28-35页
        3.3.1 文本表示过程第28-31页
        3.3.2 基于K-means的文本聚类第31-32页
        3.3.3 基于层次的文本聚类第32-35页
第四章 LDA主题模型第35-41页
    4.1 LDA的原理介绍第35-38页
    4.2 R语言新闻数据的LDA主题提取第38-41页
第五章 结论与展望第41-43页
    5.1 本文工作总结第41页
    5.2 展望第41-43页
参考文献第43-45页
致谢第45页

论文共45页,点击 下载论文
上一篇:计算机可视化参数分析方法试用于单簧管演奏教学之案例研究
下一篇:基于个性化推荐的Android开发能力在线评测系统