首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop的HM-LDA生成模型研究

摘要第1-5页
ABSTRACT第5-8页
第一章 绪论第8-17页
 第一节 论文研究背景和意义第8-10页
 第二节 国内外研究现状第10-14页
  一、主题挖掘的发展历程第10-11页
  二、主题模型研究现状第11-13页
  三、Hadoop发展历程和现状第13-14页
 第三节 论文研究内容第14-15页
 第四节 论文组织架构第15-17页
第二章 相关技术研究第17-35页
 第一节 文本预处理第17-19页
  一、分词技术第17-18页
  二、正则表达式第18-19页
 第二节 LDA主题模型第19-23页
  一、LDA生成模型简介第19-22页
  二、LDA模型训练第22页
  三、LDA模型的特征和优势第22-23页
 第三节 聚类分析技术第23-30页
  一、聚类概念与聚类过程第23-24页
  二、聚类分析中的数据结构第24-25页
  三、主要的聚类算法第25-30页
 第四节 Hadoop技术架构第30-34页
  一、Hadoop的工作方式及总体架构第30-31页
  二、HDFS的架构第31-33页
  三、MapReduce编程模型第33-34页
 第五节 本章小结第34-35页
第三章 基于Hado op的HM- LDA主题生成模型第35-52页
 第一节 算法基本思想和结构第35-36页
 第二节 文本噪音处理第36-39页
 第三节 HM-LDA主题生成模型第39-46页
  一、生成主题词第39-43页
  二、层次聚类算法第43-45页
  三、算法小结第45-46页
 第四节 基于Hadoop的主题生成第46-51页
  一、Map/reduce中文分词预处理第46-48页
  二、HM-LDA主题模型建立和参数估计第48-51页
 第五节 本章小结第51-52页
第四章 实验和结果分析第52-61页
 第一节 实验环境和数据获取第52-56页
  一、实验环境第52页
  二、实验数据获取第52-56页
 第二节 实验结果分析第56-60页
  一、与传统LDA算法的精度对比第56-57页
  二、速度性能对比第57-60页
 第三节 本章小结第60-61页
第五章 总结与展望第61-63页
参考文献第63-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:论纸纤维媒材在当代纤维艺术中的可塑性
下一篇:政府采购寻租及治理分析