Hadoop平台下基于LDA的新闻推荐算法研究

摘要	第1-4页
abstract	第4-8页
第1章绪论	第8-14页
·研究背景	第8页
·研究意义	第8-9页
·研究现状	第9-12页
·推荐系统简介	第9-10页
·推荐系统	第9页
·推荐系统评估	第9页
·推荐系统的推荐邻域	第9-10页
·新闻推荐方法概述	第10-11页
·聚类推荐的难点与问题	第11页
·采用Hadoop平台	第11-12页
·实验平台介绍	第12页
·本文主要工作	第12-13页
·本章小结	第13-14页
第2章文本聚类相关技术简介	第14-25页
·中文文本分词系统	第14-17页
·ICTCLAS汉语分词系统	第15页
·ICTCLAS分词系统接口	第15-16页
·接口声明	第15-16页
·实施分词处理	第16页
·ICTCLAS的缺陷	第16-17页
·关键词抽取聚类	第17-21页
·Canopy聚类算法	第17-18页
·相似性度量计算方法	第18-20页
·TF与TF-IDF	第20-21页
·主题抽取聚类LDA	第21-23页
·LDA的数学模型	第21-23页
·LDA的求解方法	第23页
·聚类算法对比与选取	第23-24页
·聚类算法对比	第23-24页
·聚类方案的取舍	第24页
·本章小结	第24-25页
第3章文本分词及降噪优化	第25-32页
·语料库的选取	第25-26页
·加入自定义词	第26页
·停用词的剔除	第26-30页
·首次词性对比建树降噪	第27-29页
·二次停用词建树降噪	第29-30页
·文本降噪总结	第30页
·降频优化处理	第30-31页
·实施聚类后反馈降噪	第31页
·本章小结	第31-32页
第4章 LDA聚类分析与优化	第32-39页
·LDA的求解	第32-34页
·变分贝叶斯期望最大化求解	第32-33页
·吉布斯采样求解	第33-34页
·塌缩吉布斯采样求解	第34页
·塌缩变分贝叶斯求解	第34页
·LDA训练的实现	第34-37页
·使用Hadoop平台进行运算	第34-35页
·MapReduce模型及程序开发	第35-36页
·CVB算法的hadoop实现	第36-37页
·主题数优化分析	第37页
·降频与平滑度优化	第37-38页
·迭代次数优化	第38页
·本章小结	第38-39页
第5章验证实验及分析	第39-60页
·分词系统的改进实验	第39-41页
·自定义新词改善分词系统	第39-40页
·二次建树优化文本降噪	第40页
·降频优化处理	第40页
·实验数据分析	第40-41页
·聚类实验对比	第41-45页
·实施词抽取实验	第41-43页
·使用K-means算法细化聚类	第43-44页
·关键词抽取实验分析	第44页
·主题抽取实验及分析	第44-45页
·LDA聚类优化实验	第45-52页
·主题数对比实验	第45-47页
·降频对比实验	第47-48页
·平滑度对比实验	第48-50页
·迭代次数对比实验	第50-52页
·反馈去噪改良聚类及分析	第52-54页
·聚类总体效果分析	第54页
·新闻推荐及结果分析	第54-59页
·算法及流程整合	第55-56页
·新闻推荐过程介绍	第56-58页
·推荐结果分析	第58-59页
·本章小结	第59-60页
总结与展望	第60-62页
致谢	第62-63页
参考文献	第63-66页
攻读学位期间发表的论文	第66页