首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的分布式全文检索及相关技术研究

摘要第1-6页
ABSTRACT第6-8页
目录第8-11页
表格第11-12页
插图第12-14页
第一章 绪论第14-22页
   ·研究背景第14-18页
   ·国内外研究状况第18-20页
   ·研究内容第20-21页
   ·章节安排第21-22页
第二章 相关技术综述第22-38页
   ·引言第22页
   ·全文检索相关技术第22-29页
     ·全文检索的基本概念第22-25页
     ·索引结构第25-26页
     ·检索模型第26-28页
     ·中文分词第28-29页
   ·Hadoop分布式计算平台第29-34页
     ·MapReduce计算模型第30-32页
     ·HDFS分布式文件系统第32-34页
   ·文件预处理相关概念与技术第34-37页
     ·文件类型识别技术第34-35页
     ·字符编码的基本概念第35-37页
   ·本章小结第37-38页
第三章 基于Hadoop的分布式全文检索系统设计与实现第38-52页
   ·引言第38-39页
   ·总体设计方案第39-40页
   ·数据接收前端第40-41页
   ·索引模块第41-44页
     ·输入格式第42-43页
     ·Map过程第43-44页
     ·Reduce过程第44页
   ·搜索模块第44-46页
     ·索引分发与管理第44-45页
     ·搜索接口第45-46页
   ·实验及结果分析第46-51页
     ·实验平台搭建第46-50页
     ·实验及结果分析第50-51页
   ·本章小结第51-52页
第四章 文件预处理第52-68页
   ·引言第52页
   ·文件类型识别第52-55页
     ·文件类型识别方法第52-54页
     ·文件类型的表示第54-55页
   ·字符编码识别第55-57页
     ·字符编码识别方法第55-57页
   ·文本抽取第57-61页
     ·插件机制第57-59页
     ·多进程与任务调度第59-61页
   ·字符编码转换第61-62页
   ·测试及结果分析第62-66页
   ·本章小结第66-68页
第五章 总结与展望第68-70页
   ·本文工作总结第68-69页
   ·研究展望第69-70页
参考文献第70-74页
致谢第74-76页
在读期间发表的学术论文与取得的研究成果第76-77页

论文共77页,点击 下载论文
上一篇:基于人类视觉机制的自适应粒子滤波目标跟踪研究
下一篇:基于ASP.NET MVC框架的大学英语四级诊断性练习系统的设计与实现