首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Hadoop平台下基于LDA的新闻推荐算法研究

摘要第1-4页
abstract第4-8页
第1章 绪论第8-14页
   ·研究背景第8页
   ·研究意义第8-9页
   ·研究现状第9-12页
     ·推荐系统简介第9-10页
       ·推荐系统第9页
       ·推荐系统评估第9页
       ·推荐系统的推荐邻域第9-10页
     ·新闻推荐方法概述第10-11页
     ·聚类推荐的难点与问题第11页
     ·采用Hadoop平台第11-12页
     ·实验平台介绍第12页
   ·本文主要工作第12-13页
   ·本章小结第13-14页
第2章 文本聚类相关技术简介第14-25页
   ·中文文本分词系统第14-17页
     ·ICTCLAS汉语分词系统第15页
     ·ICTCLAS分词系统接口第15-16页
       ·接口声明第15-16页
       ·实施分词处理第16页
     ·ICTCLAS的缺陷第16-17页
   ·关键词抽取聚类第17-21页
     ·Canopy聚类算法第17-18页
     ·相似性度量计算方法第18-20页
     ·TF与TF-IDF第20-21页
   ·主题抽取聚类LDA第21-23页
     ·LDA的数学模型第21-23页
     ·LDA的求解方法第23页
   ·聚类算法对比与选取第23-24页
     ·聚类算法对比第23-24页
     ·聚类方案的取舍第24页
   ·本章小结第24-25页
第3章 文本分词及降噪优化第25-32页
   ·语料库的选取第25-26页
   ·加入自定义词第26页
   ·停用词的剔除第26-30页
     ·首次词性对比建树降噪第27-29页
     ·二次停用词建树降噪第29-30页
     ·文本降噪总结第30页
   ·降频优化处理第30-31页
   ·实施聚类后反馈降噪第31页
   ·本章小结第31-32页
第4章 LDA聚类分析与优化第32-39页
   ·LDA的求解第32-34页
     ·变分贝叶斯期望最大化求解第32-33页
     ·吉布斯采样求解第33-34页
     ·塌缩吉布斯采样求解第34页
     ·塌缩变分贝叶斯求解第34页
   ·LDA训练的实现第34-37页
     ·使用Hadoop平台进行运算第34-35页
     ·MapReduce模型及程序开发第35-36页
     ·CVB算法的hadoop实现第36-37页
   ·主题数优化分析第37页
   ·降频与平滑度优化第37-38页
   ·迭代次数优化第38页
   ·本章小结第38-39页
第5章 验证实验及分析第39-60页
   ·分词系统的改进实验第39-41页
     ·自定义新词改善分词系统第39-40页
     ·二次建树优化文本降噪第40页
     ·降频优化处理第40页
     ·实验数据分析第40-41页
   ·聚类实验对比第41-45页
     ·实施词抽取实验第41-43页
     ·使用K-means算法细化聚类第43-44页
     ·关键词抽取实验分析第44页
     ·主题抽取实验及分析第44-45页
   ·LDA聚类优化实验第45-52页
     ·主题数对比实验第45-47页
     ·降频对比实验第47-48页
     ·平滑度对比实验第48-50页
     ·迭代次数对比实验第50-52页
   ·反馈去噪改良聚类及分析第52-54页
   ·聚类总体效果分析第54页
   ·新闻推荐及结果分析第54-59页
     ·算法及流程整合第55-56页
     ·新闻推荐过程介绍第56-58页
     ·推荐结果分析第58-59页
   ·本章小结第59-60页
总结与展望第60-62页
致谢第62-63页
参考文献第63-66页
攻读学位期间发表的论文第66页

论文共66页,点击 下载论文
上一篇:基于视频图像的车辆检测算法研究
下一篇:基于SNS的威客平台关键技术的研究与应用