摘要 | 第1-4页 |
Abstract | 第4-8页 |
第一章 绪论 | 第8-13页 |
·课题研究背景 | 第8-9页 |
·国内外研究现状 | 第9-10页 |
·课题研究内容与意义 | 第10-12页 |
·论文结构 | 第12-13页 |
第二章 Hadoop 平台的相关技术研究 | 第13-20页 |
·Hadoop 概述 | 第13-14页 |
·Hadoop 分布式文件系统 HDFS | 第14-16页 |
·HDFS 体系结构 | 第14-15页 |
·HDFS 的可靠性措施 | 第15-16页 |
·Hadoop 分布式数据处理 MapReduce | 第16-20页 |
·MapReduce 工作原理 | 第16-18页 |
·MapReduce 组成部分 | 第18-20页 |
第三章 Web 文本检索技术及 Nutch 分布式搜索引擎 | 第20-31页 |
·Web 文本检索技术 | 第20-22页 |
·Web 数据检索简介 | 第20页 |
·通用搜索引擎工作原理 | 第20-21页 |
·搜索引擎的相关技术 | 第21-22页 |
·Nutch 分布式搜索引擎 | 第22-31页 |
·Nutch 的简介及特点 | 第22-24页 |
·Nutch 的基本框架 | 第24-26页 |
·Nutch 网络爬虫模块 | 第26-27页 |
·Nutch 索引模块 | 第27-29页 |
·Nutch 检索模块 | 第29-31页 |
第四章 基于 Hadoop 文本检索系统的详细设计 | 第31-51页 |
·开发中遇到的技术难题及解决办法 | 第31-34页 |
·维吾尔语文字特征 | 第31页 |
·维吾尔语文字处理技术的实现 | 第31-32页 |
·维吾尔语的词切分技术 | 第32-34页 |
·Hadoop 平台的搭建 | 第34-42页 |
·实验环境 | 第34-35页 |
·Hadoop 伪分布式配置过程 | 第35-38页 |
·完全分布式配置过程 | 第38-42页 |
·Nuch 分布式配置与运行 | 第42-46页 |
·Nutch 的相关配置 | 第42-43页 |
·系统爬虫过程 | 第43-45页 |
·系统检索过程 | 第45-46页 |
·试验结果和分析 | 第46-51页 |
第五章 总结与展望 | 第51-52页 |
参考文献 | 第52-54页 |
研究生期间发表论文 | 第54-55页 |
致谢 | 第55页 |