首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于LDA融合模型和多层聚类的新闻话题检测

摘要第4-5页
ABSTRACT第5页
第1章 绪论第8-14页
    1.1 研究背景与意义第8-9页
    1.2 研究现状及问题分析第9-12页
        1.2.1 话题检测与跟踪技术研究现状第9-11页
        1.2.2 问题分析第11-12页
    1.3 研究目标及内容第12-13页
        1.3.1 研究目标第12页
        1.3.2 研究内容第12-13页
    1.4 论文结构第13-14页
第2章 相关工作第14-24页
    2.1 文本预处理第14-16页
        2.1.1 中文分词第15页
        2.1.2 过滤停用词第15-16页
    2.2 文本表示模型第16-17页
    2.3 文本特征提取第17-19页
        2.3.1 特征提取第17-18页
        2.3.2 相似度计算第18-19页
    2.4 文本聚类算法第19-21页
        2.4.1 层次聚类算法第20-21页
        2.4.2 划分聚类算法第21页
        2.4.3 增量聚类算法第21页
    2.5 本章小结第21-24页
第3章 基于LDA融合模型的新闻文本聚类第24-40页
    3.1 主题模型第24-26页
        3.1.1 VSM模型第24-25页
        3.1.2 LSI模型第25页
        3.1.3 PLSI模型第25-26页
    3.2 基于LDA融合模型的新闻文本聚类第26-32页
        3.2.1 LDA主题模型第27-29页
        3.2.2 参数估计第29-30页
        3.2.3 基于LDA的文本相似度计算第30-32页
    3.3 数据获取与预处理第32-33页
        3.3.1 定制网络爬虫第32页
        3.3.2 中文分词第32页
        3.3.3 其他预处理第32-33页
    3.4 实验结果及分析第33-40页
        3.4.1 实验环境第33页
        3.4.2 数据来源第33-34页
        3.4.3 评价指标第34-35页
        3.4.4 实验结果与分析第35-40页
第4章 基于ISP&AH聚类算法的话题检测第40-50页
    4.1 传统增量聚类算法设计第40-41页
        4.1.1 传统增量聚类算法第40-41页
        4.1.2 传统增量聚类算法不足第41页
    4.2 改进的增量聚类算法设计第41-43页
    4.3 基于ISP&AH聚类算法设计第43-45页
        4.3.1 层次聚类算法及其缺点第43-44页
        4.3.2 基于ISP&AH聚类算法实现第44-45页
    4.4 实验结果分析及总结第45-50页
        4.4.1 实验结果分析第45-48页
        4.4.2 实验结果小结第48-50页
第5章 总结与展望第50-52页
    5.1 总结第50页
    5.2 不足之处第50-51页
    5.3 展望第51-52页
参考文献第52-56页
发表论文和参加科研情况说明第56-58页
致谢第58-59页

论文共59页,点击 下载论文
上一篇:协同过滤算法相似度的研究及并行化的实现
下一篇:突发事件舆情案例建模研究