首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

分布式环境下基于文本的海量数据挖掘

摘要第1-5页
ABSTRACT第5-10页
表格索引第10-11页
插图索引第11-12页
第一章 绪论第12-18页
   ·研究背景与意义第12-13页
   ·国内外研究现状第13-16页
     ·数据仓库搭建第13-14页
     ·数据挖掘第14-16页
   ·研究内容第16-17页
   ·论文组织结构第17页
   ·本章小结第17-18页
第二章 相关技术研究第18-28页
   ·Apache Hadoop第18-21页
     ·HDFS第18-19页
     ·MapReduce第19-21页
   ·MongoDB第21-23页
     ·单节点数据库第21-22页
     ·JSON第22页
     ·分片机制第22-23页
     ·MongoDB Cluster第23页
   ·Apache Lucene第23-26页
     ·基本过程第24-25页
     ·评分第25页
     ·Luke第25-26页
   ·中文分词系统第26-27页
     ·IKAnalyzer第26-27页
     ·ICTCLAS第27页
   ·本章小结第27-28页
第三章 基于 NoSQL 的文本数据仓库搭建第28-44页
   ·传统数据仓库搭建方法及问题第28-31页
   ·NoSQL 数据库的特点第31-33页
   ·ETL 过程的并行实现方法第33-35页
     ·文本化阶段第33-34页
     ·聚合阶段第34页
     ·数据加载阶段第34-35页
   ·实验第35-39页
     ·实验环境第36页
     ·实验数据集第36-37页
     ·实验步骤第37-39页
   ·性能评估第39-42页
     ·可扩展性第39-40页
     ·效率第40-41页
     ·异构性第41-42页
   ·本章小结第42-44页
第四章 基于文本数据仓库的海量数据挖掘第44-66页
   ·问题描述第44-46页
   ·现有的解决方案第46-48页
     ·传统数据挖掘算法的解决方案第46-47页
     ·基于协同过滤的推荐系统第47-48页
   ·基于 TF·IDF 的解决方案第48-53页
     ·文本信息量评估第48-51页
     ·微博用户推荐第51-53页
   ·实验第53-61页
     ·系统架构第53-55页
     ·数据集获取第55-57页
     ·建立索引第57-58页
     ·计算 TF·IDF 值第58-61页
   ·实验结果第61-64页
     ·生成推荐列表第61页
     ·基础推荐策略第61页
     ·多维特征词组匹配第61-63页
     ·用户最近时间加权第63-64页
     ·实验结果说明第64页
   ·本章小结第64-66页
第五章 总结与展望第66-68页
   ·全文总结第66页
   ·未来展望第66-68页
参考文献第68-72页
致谢第72-73页
攻读学位期间发表的学术论文目录第73-75页

论文共75页,点击 下载论文
上一篇:智能购物中心情境下上下文感知推荐系统研究与开发
下一篇:基于框架小波的彩色图像去马赛克