首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Hadoop的分布式垂直搜索引擎研究与设计

摘要第1-5页
ABSTRACT第5-8页
第一章 绪论第8-12页
 §1-1 研究背景和意义第8页
 §1-2 国内外研究现状第8-9页
 §1-3 搜索引擎发展趋势第9-10页
 §1-4 研究内容及组织结构第10-12页
  1-4-1 论文的主要工作第10页
  1-4-2 论文的组织结构第10-12页
第二章 搜索引擎相关理论概述第12-19页
 §2-1 通用搜索引擎介绍第12-13页
  2-1-1 通用搜索引擎工作原理第12-13页
  2-1-2 通用搜索引擎不足之处第13页
 §2-2 垂直搜索引擎介绍第13-14页
  2-2-1 垂直搜索引擎的定义第13页
  2-2-2 与通用搜索引擎比较第13-14页
 §2-3 与搜索相关的开源组件第14-18页
  2-3-1 Nutch 和 Solr 简介第14页
  2-3-2 Nutch 与 Solr 原理第14-17页
  2-3-3 Hadoop 分布式平台第17-18页
 §2-4 本章小结第18-19页
第三章 搜索引擎关键技术研究第19-25页
 §3-1 领域本体技术研究第19-20页
  3-1-1 本体论概述第19页
  3-1-2 本体构建方法第19-20页
  3-1-3 本体构建工具第20页
 §3-2 主题相关度判别研究第20-22页
  3-2-1 布尔模型第21页
  3-2-2 向量空间模型第21-22页
  3-2-3 相关度模型的评价第22页
 §3-3 通用搜索排序算法研究第22-24页
  3-3-1 词频位置加权算法第23页
  3-3-2 PageRank 算法第23页
  3-3-3 HITS 算法第23-24页
  3-3-4 排序算法的评价第24页
 §3-4 本章小结第24-25页
第四章 分布式垂直搜索设计与实现第25-41页
 §4-1 系统总体设计第25-27页
  4-1-1 系统体系结构第25-26页
  4-1-2 系统功能模块第26-27页
 §4-2 网页抓取子系统实现第27-33页
  4-2-1 起始链接列表第27-29页
  4-2-2 主题词库构建第29-31页
  4-2-3 主题相关度判别第31-33页
 §4-3 网页检索子系统实现第33-40页
  4-3-1 用户云桌面第33-34页
  4-3-2 添加中文分词第34-35页
  4-3-3 领域本体库构建第35-38页
  4-3-4 本体语义扩展查询第38-39页
  4-3-5 改进结果排序算法第39-40页
 §4-4 本章小结第40-41页
第五章 系统运行与分析第41-50页
 §5-1 实验平台第41-45页
  5-1-1 软硬件环境第41页
  5-1-2 Hadoop 集群搭建第41-43页
  5-1-3 Nutch 和 Solr 部署第43-45页
 §5-2 实验验证第45-49页
  5-2-1 界面展示第45-47页
  5-2-2 评价标准第47页
  5-2-3 结果分析第47-49页
 §5-3 本章小结第49-50页
第六章 总结和展望第50-51页
 §6-1 论文总结第50页
 §6-2 论文展望第50-51页
参考文献第51-53页
致谢第53页

论文共53页,点击 下载论文
上一篇:交互式电子白板软件系统的设计与实现
下一篇:基于视觉注意机制的静态图像压缩方法研究