首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于云计算的文本挖掘技术研究

摘要第1-11页
ABSTRACT第11-12页
第一章 绪论第12-20页
   ·课题背景与研究意义第12-14页
     ·课题背景第12-13页
     ·研究意义第13-14页
   ·研究现状第14-18页
     ·云计算研究现状第14-16页
     ·文本挖掘研究现状第16-17页
     ·基于云计算的文本挖掘第17-18页
     ·需要进一步研究的问题第18页
   ·课题研究内容第18-19页
   ·论文组织结构第19-20页
第二章 基于云计算的文本挖掘原型系统设计第20-37页
   ·云计算关键技术第20-27页
   ·云计算平台--Hadoop搭建方法第27-33页
     ·Hadoop概述第27-28页
     ·Hadoop实验平台及其基本配置第28-33页
   ·云计算文本挖掘系统模型第33-36页
     ·原型系统总体架构设计第33-34页
     ·人机交互子系统第34-35页
     ·挖掘管理子系统第35页
     ·资源管理子系统第35-36页
   ·本章小结第36-37页
第三章 文本预处理中停用词表的构造及其过滤算法第37-52页
   ·停用词综述第37-42页
     ·停用词第37-38页
     ·停用词表构造原则及方法第38-40页
     ·停用词的自动抽取第40-42页
   ·停用词表构造方法的改进第42-43页
   ·一种综合停用词表构造方法第43-46页
     ·综合停用词表的构造原理第43-44页
     ·综合停用词表的设计步骤及结果第44-46页
   ·停用词过滤算法设计第46-49页
     ·顺序查找过滤法第46-47页
     ·最近最常使用过滤法第47-48页
     ·哈希表过滤法第48-49页
   ·实验与分析第49-51页
     ·过滤算法分析第49页
     ·实验结果第49-51页
   ·本章小结第51-52页
第四章 基于MapReduce的文本预处理方法研究第52-62页
   ·文本预处理流程第52-53页
   ·文本预处理方法第53-56页
     ·文本读取第53页
     ·分词第53-54页
     ·停用词过滤第54页
     ·特征降维第54-56页
     ·文本表示第56页
   ·基于MapReduce的文本预处理方法第56-59页
     ·文本预处理的MapReduce化第57页
     ·文本数据的划分第57-58页
     ·Map详细设计第58页
     ·Reduce详细设计第58-59页
   ·实验分析第59-61页
     ·实验环境第59-60页
     ·实验结果及分析第60-61页
   ·本章小结第61-62页
第五章 基于MapReduce的Jarvis-Patrick聚类算法研究第62-78页
   ·文本聚类第62-66页
     ·文本聚类的主要方法第62-64页
     ·聚类算法在文本挖掘中的困难第64-66页
   ·Jarvis-Patrick聚类算法第66-70页
     ·稀疏化邻近度矩阵第67-68页
     ·共享最近邻SNN相似度第68-70页
     ·Jarvis-Patrick聚类算法第70页
   ·基于MapReduce的Jarvis-Patrick算法第70-76页
     ·Jarvis-Patrick算法的MapReduce化第70-72页
     ·数据划分第72页
     ·Map详细设计第72-73页
     ·Reduce详细设计第73-75页
     ·聚类簇提取第75-76页
   ·实验分析第76-77页
   ·本章小结第77-78页
第六章 总结与展望第78-80页
   ·总结第78-79页
   ·展望第79-80页
致谢第80-81页
参考文献第81-87页
作者在学期间取得的学术成果第87-88页
附录A 攻读硕士学位期间参加科研情况第88页

论文共88页,点击 下载论文
上一篇:面向信息物理融合系统的软件动态配置模型研究
下一篇:基于关系数据库的OWL本体的提取与存储研究