首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于LDA模型的新闻话题发现研究

摘要第4-5页
Abstract第5页
第一章 引言第8-10页
    1.1 研究背景及意义第8-9页
    1.2 本文主要内容第9页
    1.3 论文的结构安排第9-10页
第二章 相关理论与关键技术第10-19页
    2.1 数据挖掘第10-11页
        2.1.1 数据挖掘主要任务第10页
        2.1.2 数据挖掘主要步骤第10-11页
    2.2 话题发现的相关技术第11-18页
        2.2.1 话题发现流程第11页
        2.2.2 语料采集与预处理第11-13页
        2.2.3 文本模型表示第13-15页
        2.2.4 文档间相似度量准则第15页
        2.2.5 文本聚类主要算法第15-18页
    2.3 本章小结第18-19页
第三章 基于 LDA 主题模型的新闻文本聚类第19-28页
    3.1 LDA 模型介绍第19-22页
        3.1.1 LDA 主题挖掘第19-21页
        3.1.2 参数估计第21-22页
    3.2 基于 LDA 模型的文本聚类第22-24页
        3.2.1 新闻文本的模型表示第22-23页
        3.2.2 基于 LDA 的文本相似度计算第23-24页
    3.3 基于 LDA 模型的簇主题识别第24-27页
        3.3.1 聚簇主题识别方法简介第24页
        3.3.2 主题识别的评价方法第24-25页
        3.3.3 基于 LDA 模型的聚簇主题识别第25-27页
    3.4 本章小结第27-28页
第四章 实验结果与分析第28-37页
    4.1 语料选择与实验环境第28页
        4.1.1 实验数据第28页
        4.1.2 实验环境第28页
    4.2 性能评价指标第28-29页
    4.3 LDA 建模平台搭建第29-33页
        4.3.1 最优主题数 T 的选择第29-30页
        4.3.2 文本建模结果第30-33页
    4.4 参数的选取第33页
    4.5 实验结果与分析第33-35页
        4.5.1 聚类结果分析第33-35页
        4.5.2 聚簇主题识别结果及分析第35页
    4.6 本章小结第35-37页
第五章 总结与展望第37-39页
    5.1 文章总结第37页
    5.2 研究展望第37-39页
参考文献第39-41页
致谢第41页

论文共41页,点击 下载论文
上一篇:潮流能发电系统监控软件设计与开发
下一篇:基于MRF-MAP的超分辨率图像重建