首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Hadoop的分布式Web文本检索系统的研究与开发

摘要第1-4页
Abstract第4-8页
第一章 绪论第8-13页
   ·课题研究背景第8-9页
   ·国内外研究现状第9-10页
   ·课题研究内容与意义第10-12页
   ·论文结构第12-13页
第二章 Hadoop 平台的相关技术研究第13-20页
   ·Hadoop 概述第13-14页
   ·Hadoop 分布式文件系统 HDFS第14-16页
     ·HDFS 体系结构第14-15页
     ·HDFS 的可靠性措施第15-16页
   ·Hadoop 分布式数据处理 MapReduce第16-20页
     ·MapReduce 工作原理第16-18页
     ·MapReduce 组成部分第18-20页
第三章 Web 文本检索技术及 Nutch 分布式搜索引擎第20-31页
   ·Web 文本检索技术第20-22页
     ·Web 数据检索简介第20页
     ·通用搜索引擎工作原理第20-21页
     ·搜索引擎的相关技术第21-22页
   ·Nutch 分布式搜索引擎第22-31页
     ·Nutch 的简介及特点第22-24页
     ·Nutch 的基本框架第24-26页
     ·Nutch 网络爬虫模块第26-27页
     ·Nutch 索引模块第27-29页
     ·Nutch 检索模块第29-31页
第四章 基于 Hadoop 文本检索系统的详细设计第31-51页
   ·开发中遇到的技术难题及解决办法第31-34页
     ·维吾尔语文字特征第31页
     ·维吾尔语文字处理技术的实现第31-32页
     ·维吾尔语的词切分技术第32-34页
   ·Hadoop 平台的搭建第34-42页
     ·实验环境第34-35页
     ·Hadoop 伪分布式配置过程第35-38页
     ·完全分布式配置过程第38-42页
   ·Nuch 分布式配置与运行第42-46页
     ·Nutch 的相关配置第42-43页
     ·系统爬虫过程第43-45页
     ·系统检索过程第45-46页
   ·试验结果和分析第46-51页
第五章 总结与展望第51-52页
参考文献第52-54页
研究生期间发表论文第54-55页
致谢第55页

论文共55页,点击 下载论文
上一篇:基于负载均衡的Hadoop平台下作业调度算法研究
下一篇:维吾尔语文本聚类算法研究