首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Hadoop平台的网页聚类方法研究

摘要第1-6页
Abstract第6-9页
第一章 绪论第9-15页
   ·研究背景和意义第9-10页
   ·国内外相关研究现状第10-13页
     ·网页聚类的研究现状第10-11页
     ·聚类算法的研究现状第11-12页
     ·可扩展的聚类算法研究现状第12-13页
   ·主要研究内容第13-14页
     ·基于谱聚类的网页聚类第13页
     ·网页搜索引擎结果聚类第13-14页
     ·基于 Hadoop 平台的网页聚类第14页
   ·文章的内容框架第14-15页
第二章 Web 挖掘与 Web 信息检索第15-22页
   ·Web 挖掘第15-17页
     ·Web 内容挖掘(Web Content Mining)第15-16页
     ·Web 结构挖掘(Web Structure Mining)第16页
     ·Web 用法挖掘(Web Usage Mining)第16-17页
   ·Web 信息检索技术第17-21页
     ·信息检索模型第18-19页
     ·网页搜索引擎第19-20页
     ·网页聚类第20-21页
   ·本章小结第21-22页
第三章 Hadoop 平台概述和并行聚类算法综述第22-30页
   ·Hadoop 平台介绍第22-24页
     ·Hadoop 平台的架构第22-23页
     ·Hadoop 平台与其它系统的对比第23-24页
   ·HDFS 概述第24-25页
     ·HDFS 的基本概念第24-25页
     ·HDFS 的系统架构第25页
   ·MapReduce 编程模型第25-27页
     ·MapReduce 的系统架构第25页
     ·MapReduce 的执行流程第25-26页
     ·MapReduce 与 MPI 的对比第26-27页
   ·并行聚类算法第27-29页
     ·并行 K-Means 算法第27-28页
     ·并行谱聚类算法第28-29页
   ·本章小结第29-30页
第四章 基于谱聚类的串行网页聚类第30-51页
   ·网页聚类的一般步骤第30-35页
     ·网页正文提取第30-31页
     ·网页分词第31-32页
     ·网页表示第32-33页
     ·网页相似性计算第33页
     ·聚类分析第33-34页
     ·网页聚类的评价第34-35页
   ·网页聚类实现第35-39页
     ·构建网页的相似性矩阵第35-36页
     ·网页聚类分析第36-39页
   ·搜索引擎结果聚类方法第39-43页
     ·搜索结果聚类的目的第39-41页
     ·搜索结果聚类预处理第41-42页
     ·搜索结果聚类分析第42-43页
     ·聚类结果的显示第43页
   ·系统实现第43-48页
     ·构建搜索引擎第43-46页
     ·搜索结果聚类效果第46-48页
   ·实验分析第48-50页
     ·网页聚类效果评价第48-49页
     ·网页聚类性能分析第49-50页
   ·本章小结第50-51页
第五章 基于 Hadoop 平台的并行网页聚类第51-70页
   ·网页聚类并行化分析第51-53页
     ·需并行的网页聚类算法第51页
     ·谱聚类划分方法的并行化分析第51-53页
   ·并行网页聚类第53-63页
     ·并行化构建网页向量第53-56页
     ·并行相似性矩阵计算第56-58页
     ·矩阵相乘的并行化第58页
     ·特征向量计算的并行化第58-59页
     ·数据划分的并行化第59-63页
   ·实验结果第63-69页
     ·Hadoop 平台的搭建第63-64页
     ·预处理实验及分析第64页
     ·相似矩阵计算实验及分析第64-66页
     ·求解特征向量实验分析第66-67页
     ·数据划分实验及分析第67页
     ·总体评价第67-69页
   ·本章小结第69-70页
总结与展望第70-72页
参考文献第72-77页
攻读硕士学位期间取得的研究成果第77-78页
致谢第78页

论文共78页,点击 下载论文
上一篇:可用带宽测量和网络流量监控的研究与实现
下一篇:Rainbow密码硬件安全性分析工具的设计与实现