首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Nutch的农业信息垂直搜索引擎的研究与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 引言第9-11页
   ·课题背景第9页
   ·课题任务第9页
   ·论文结构第9-11页
第二章 搜索引擎概述第11-20页
   ·搜索引擎概念第11-13页
     ·信息检索第11页
     ·搜索引擎的概念第11页
     ·搜索引擎的使用第11-12页
     ·搜索引擎发展历史第12-13页
   ·搜索引擎分类第13-14页
     ·按照工作方式分类第13页
     ·按照领域范围分类第13页
     ·按照信息类型分类第13-14页
   ·主流搜索引擎第14-15页
     ·全球著名搜索引擎第14页
     ·中文搜索引擎的发展历史第14页
     ·其他细化搜索引擎第14-15页
   ·搜索引擎评价原则第15-16页
   ·未来搜索技术前瞻第16-17页
     ·现状存在问题第16页
     ·未来发展趋势第16-17页
   ·搜索引擎原理第17页
   ·开源搜索引擎NUTCH第17-19页
     ·Nutch简介第17-18页
     ·Nutch架构第18页
     ·Nutch命令第18页
     ·Nutch存储形式第18-19页
   ·本章小结第19-20页
第三章 基于NUTCH的农业信息垂直搜索引擎需求分析第20-26页
   ·农业搜索的现状分析第20-23页
   ·农业搜索的特点与功能需求第23-25页
   ·基于NUTCH构建农业信息搜索引擎的可行性分析第25-26页
第四章 基于NUTCH的农业信息垂直搜索引擎设计第26-49页
   ·系统运行环境第26页
   ·系统总体架构第26-27页
   ·构建农业领域本体第27-28页
     ·本体概念第27页
     ·构建本体语言工具第27页
     ·构建农业领域本体第27-28页
     ·农业领域本体的推理第28页
     ·农业领域本体的应用第28页
   ·网络爬虫设计第28-35页
     ·网络爬虫策略分析第28-29页
     ·网络爬虫功能设计第29页
     ·网络爬虫结构第29-32页
     ·网络爬虫效率优化第32页
     ·网络爬虫的黑洞第32页
     ·主题爬虫第32-35页
     ·网络爬虫访问规范第35页
   ·文档分析与中文分词设计第35-37页
     ·文档分析功能需求第35页
     ·文档分析方法第35页
     ·文档分析结构第35-36页
     ·中文分词方法第36-37页
     ·Lucene中文分词第37页
     ·非结构化文本处理第37页
   ·文档索引设计第37-39页
     ·索引功能需求第37页
     ·文档索引方法第37-38页
     ·实现倒排索引第38-39页
     ·选择索引类型第39页
   ·文档检索设计第39-42页
     ·检索功能需求第39页
     ·检索基本流程第39-40页
     ·查询结果显示第40页
     ·高性能查询第40页
     ·搜索缓存设计第40-41页
     ·利用“语义指纹”排除重复文档第41-42页
     ·Simhash重排第42页
   ·搜索引擎结果排序设计第42-45页
     ·传统检索排序技术第42-43页
     ·搜索引擎相关性排序设计第43页
     ·链接分析PageRank第43-44页
     ·链接分析HITS第44页
     ·PageRank与HITS的比较第44页
     ·搜索引擎排序流程第44-45页
   ·分布式检索设计第45-48页
     ·MapReduce系统介绍第45-47页
     ·Nutch分布式检索第47-48页
   ·本章小结第48-49页
第五章 基于NUTCH的农业信息垂直搜索引擎的实现第49-65页
   ·构建农业领域本题的实现第49-50页
   ·农业关键词管理的实现第50-51页
     ·农业关键词策略第50页
     ·农业关键词存储设计第50页
     ·农业关键词管理程序第50-51页
   ·农业资源发现的实现第51-53页
   ·农业信息下载的实现第53-56页
   ·网页信息分析的实现第56-58页
     ·网页内容解析第56-58页
     ·创建索引第58页
   ·农业信息检索的实现第58-64页
     ·检索后台实现第59-61页
     ·检索前台实现第61-64页
   ·本章小结第64-65页
第六章 结束语第65-66页
   ·论文工作总结第65页
   ·问题和展望第65-66页
参考文献第66-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:基于HTML5的新闻类移动应用框架设计与实现
下一篇:GPRS网络下典型移动互联网应用软件行为分析及仿真