首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

并行LDA、聚类算法的研究及应用

摘要第3-4页
Abstract第4-5页
第1章 绪论第9-15页
    1.1 研究背景第9-10页
    1.2 国内外研究现状第10-13页
        1.2.1 并行LDA算法的研究现状第10-11页
        1.2.2 二分K均值算法的研究现状第11-12页
        1.2.3 词语相似度计算方法的研究现状第12-13页
    1.3 本文的研究工作第13-14页
    1.4 论文结构第14-15页
第2章 相关技术第15-24页
    2.1 Spark第15-17页
        2.1.1 Spark生态系统第15-17页
        2.1.2 Spark核心概念第17页
    2.2 HowNet第17-20页
    2.3 ICTCLAS第20-21页
    2.4 文本主题挖掘方法第21-23页
    2.5 本章小结第23-24页
第3章 基于Spark的LDA并行算法第24-38页
    3.1 LDA主题模型及其推导第24-28页
        3.1.1 LDA主题模型第24-25页
        3.1.2 吉布斯采样第25-27页
        3.1.3 基于吉布斯采样的模型推导第27-28页
    3.2 基于Spark的LDA算法并行设计第28-33页
        3.2.1 并行算法设计思想第28-30页
        3.2.2 并行LDA算法的实现第30-33页
    3.3 实验与分析第33-37页
        3.3.1 实验环境第33-34页
        3.3.2 实验数据来源第34页
        3.3.3 实验内容与结论第34-37页
    3.4 本章小结第37-38页
第4章 基于Spark的二分K均值并行算法第38-46页
    4.1 二分K均值算法及优化第38-40页
    4.2 二分K均值算法的并行设计第40-42页
    4.3 实验与分析第42-45页
        4.3.1 改进的二分K均值算法实验第42-44页
        4.3.2 并行二分K均值算法实验第44-45页
    4.4 本章小结第45-46页
第5章 基于How Net的词语相似度计算第46-54页
    5.1 基于HowNet的词语相似度计算方法第46-48页
    5.2 基于HowNet的词语相似度计算方法的改进第48-51页
        5.2.1 义原相似度计算方法的改进第48-49页
        5.2.2 概念相似度计算方法的改进第49-51页
    5.3 实验与分析第51-53页
        5.3.1 实验环境第51页
        5.3.2 实验结果与分析第51-53页
    5.4 本章小结第53-54页
第6章 微博广告定向投放设计第54-63页
    6.1 微博广告定向投放方法第54-56页
        6.1.1 微博用户兴趣挖掘第54-55页
        6.1.2 微博广告的定向投放第55-56页
    6.2 微博文本的特点及处理第56-57页
    6.3 设计思路第57-59页
    6.4 方案实现第59-62页
        6.4.1 微博数据预处理第59-60页
        6.4.2 用户兴趣挖掘第60-62页
        6.4.3 广告的定向投放第62页
    6.5 本章小结第62-63页
第7章 总结与展望第63-65页
参考文献第65-67页

论文共67页,点击 下载论文
上一篇:硫氧混合型铜矿中Cu及伴生Au、Ag的综合回收
下一篇:高台阶拋掷爆破相似模型试验与数值模拟研究