摘要 | 第1-6页 |
Abstract | 第6-9页 |
第一章 绪论 | 第9-15页 |
·研究背景和意义 | 第9-10页 |
·国内外相关研究现状 | 第10-13页 |
·网页聚类的研究现状 | 第10-11页 |
·聚类算法的研究现状 | 第11-12页 |
·可扩展的聚类算法研究现状 | 第12-13页 |
·主要研究内容 | 第13-14页 |
·基于谱聚类的网页聚类 | 第13页 |
·网页搜索引擎结果聚类 | 第13-14页 |
·基于 Hadoop 平台的网页聚类 | 第14页 |
·文章的内容框架 | 第14-15页 |
第二章 Web 挖掘与 Web 信息检索 | 第15-22页 |
·Web 挖掘 | 第15-17页 |
·Web 内容挖掘(Web Content Mining) | 第15-16页 |
·Web 结构挖掘(Web Structure Mining) | 第16页 |
·Web 用法挖掘(Web Usage Mining) | 第16-17页 |
·Web 信息检索技术 | 第17-21页 |
·信息检索模型 | 第18-19页 |
·网页搜索引擎 | 第19-20页 |
·网页聚类 | 第20-21页 |
·本章小结 | 第21-22页 |
第三章 Hadoop 平台概述和并行聚类算法综述 | 第22-30页 |
·Hadoop 平台介绍 | 第22-24页 |
·Hadoop 平台的架构 | 第22-23页 |
·Hadoop 平台与其它系统的对比 | 第23-24页 |
·HDFS 概述 | 第24-25页 |
·HDFS 的基本概念 | 第24-25页 |
·HDFS 的系统架构 | 第25页 |
·MapReduce 编程模型 | 第25-27页 |
·MapReduce 的系统架构 | 第25页 |
·MapReduce 的执行流程 | 第25-26页 |
·MapReduce 与 MPI 的对比 | 第26-27页 |
·并行聚类算法 | 第27-29页 |
·并行 K-Means 算法 | 第27-28页 |
·并行谱聚类算法 | 第28-29页 |
·本章小结 | 第29-30页 |
第四章 基于谱聚类的串行网页聚类 | 第30-51页 |
·网页聚类的一般步骤 | 第30-35页 |
·网页正文提取 | 第30-31页 |
·网页分词 | 第31-32页 |
·网页表示 | 第32-33页 |
·网页相似性计算 | 第33页 |
·聚类分析 | 第33-34页 |
·网页聚类的评价 | 第34-35页 |
·网页聚类实现 | 第35-39页 |
·构建网页的相似性矩阵 | 第35-36页 |
·网页聚类分析 | 第36-39页 |
·搜索引擎结果聚类方法 | 第39-43页 |
·搜索结果聚类的目的 | 第39-41页 |
·搜索结果聚类预处理 | 第41-42页 |
·搜索结果聚类分析 | 第42-43页 |
·聚类结果的显示 | 第43页 |
·系统实现 | 第43-48页 |
·构建搜索引擎 | 第43-46页 |
·搜索结果聚类效果 | 第46-48页 |
·实验分析 | 第48-50页 |
·网页聚类效果评价 | 第48-49页 |
·网页聚类性能分析 | 第49-50页 |
·本章小结 | 第50-51页 |
第五章 基于 Hadoop 平台的并行网页聚类 | 第51-70页 |
·网页聚类并行化分析 | 第51-53页 |
·需并行的网页聚类算法 | 第51页 |
·谱聚类划分方法的并行化分析 | 第51-53页 |
·并行网页聚类 | 第53-63页 |
·并行化构建网页向量 | 第53-56页 |
·并行相似性矩阵计算 | 第56-58页 |
·矩阵相乘的并行化 | 第58页 |
·特征向量计算的并行化 | 第58-59页 |
·数据划分的并行化 | 第59-63页 |
·实验结果 | 第63-69页 |
·Hadoop 平台的搭建 | 第63-64页 |
·预处理实验及分析 | 第64页 |
·相似矩阵计算实验及分析 | 第64-66页 |
·求解特征向量实验分析 | 第66-67页 |
·数据划分实验及分析 | 第67页 |
·总体评价 | 第67-69页 |
·本章小结 | 第69-70页 |
总结与展望 | 第70-72页 |
参考文献 | 第72-77页 |
攻读硕士学位期间取得的研究成果 | 第77-78页 |
致谢 | 第78页 |