首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎设计分析与结果聚类改进

前言第1-5页
摘要第5-6页
Abstract第6-13页
第一章 绪论第13-25页
   ·问题的提出第13-18页
     ·搜索引擎发展历史第13-15页
       ·萌芽期第13页
       ·第一代搜索引擎—目录式搜索引擎第13页
       ·第二代搜索引擎—机器人搜索引擎第13-15页
       ·第三代搜索引擎—智能化搜索引擎第15页
     ·研究现状第15-16页
     ·搜索引擎的发展趋势第16-18页
   ·搜索引擎原理第18-22页
     ·搜索引擎的工作原理第18-20页
     ·搜索引擎采用的主要技术第20-22页
       ·网络蜘蛛第20页
       ·信息获取模型第20页
       ·文档预处理第20-21页
       ·文件索引与索引压缩第21页
       ·排序技术第21-22页
       ·搜索技术第22页
   ·搜索引擎系统的性能评价第22页
   ·课题的研究意义第22-23页
   ·本论文所做的主要工作第23页
   ·本论文的章节安排第23-25页
第二章 索引与搜索第25-51页
   ·索引概述第25-27页
   ·搜索概述第27-28页
   ·系统结构设计第28-30页
     ·系统的总体结构第28页
     ·数据流分析第28-30页
   ·索引文件格式第30-41页
     ·索引文件采用的基本数据类型第30-31页
     ·索引文件的结构第31-33页
     ·索引文件格式第33-41页
       ·索引包含的文件第34-35页
       ·段包含的文件第35-37页
       ·词项字典第37-41页
   ·优先队列的概念及其应用第41-42页
   ·索引建立及搜索过程第42-50页
     ·索引的建立第42-46页
       ·索引建立流程第42-43页
       ·分析器第43-44页
       ·文档的格式第44页
       ·索引的建立实例第44-46页
     ·搜索过程第46-50页
       ·搜索的流程第46-47页
       ·检索工具类第47-48页
       ·构建各种查询第48-49页
       ·搜索过程第49-50页
   ·本章小结第50-51页
第三章 搜索引擎设计实例分析第51-73页
   ·体系结构设计第51-53页
     ·系统的总体结构第51-52页
     ·工作流程概述第52-53页
   ·文件的存储结构第53-54页
   ·Nutch常用技术说明第54-60页
     ·插件技术第54-58页
       ·插件的体系结构第54页
       ·插件的相关概念第54-57页
       ·插件的编写实例第57页
       ·插件的运行过程第57-58页
     ·Hadoop技术第58-60页
       ·hadoop的Map/Reduce第59-60页
       ·hadoop的DFS(HDFS)第60页
   ·Nutch采用的主要数据结构第60-65页
     ·Trie树第60-62页
     ·后缀树第62-65页
       ·后缀树的构造及其应用第63-64页
       ·利用后缀树查找串S中的最长重复子串第64-65页
   ·搜索引擎的工作流程第65-72页
     ·对局域网的搜索第65-66页
     ·向WebDB中注入urls地址的过程第66-67页
     ·fetchlist的生成过程第67页
     ·从url中获取网页的相关内容(网络蜘蛛)第67-69页
       ·页面内容获取第68页
       ·页面内容的解析第68-69页
     ·链接分析第69-70页
     ·索引的建立过程第70-71页
     ·搜索过程第71-72页
   ·本章小结第72-73页
第四章 对Nutch搜索引擎聚类的改进第73-94页
   ·文本的表示第73-80页
     ·文本特征表示第73-74页
     ·文本特征提取第74-80页
       ·基本概念第74-75页
       ·后缀数组第75-80页
   ·对Nutch结构的更改第80-82页
     ·修改后的Nutch结构概图第80-81页
     ·页面的预处理第81页
     ·文档语义内容的表示第81页
     ·对Nutch索引文件的修改第81-82页
     ·对Nutch搜索部分的修改第82页
   ·Nuteh聚类的实现第82-89页
     ·聚类综述第82-83页
     ·Nutch聚类算法的实现第83-89页
       ·LSI分析第84-88页
       ·lingo聚类算法的实现第88-89页
   ·在Nutch中调用聚类搜索接口第89-91页
   ·试验结果第91-93页
   ·聚类结果的评价第93页
   ·本章小结第93-94页
第五章 总结及展望第94-95页
致谢第95-96页
参考文献第96-100页
攻读硕士期间的研究成果及发表的学术论文第100页

论文共100页,点击 下载论文
上一篇:抗拔桩承载力和变形计算方法研究
下一篇:公司章程效力研究