首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene和Heritrix搜索引擎的设计

摘要第1-4页
Abstract第4-8页
第一章 引言第8-12页
   ·课题研究背景和意义第8页
   ·国内外的现状第8-10页
   ·本文的主要工作第10页
   ·本文组织结构和章节安排第10页
     ·本文组织结构第10页
     ·本文章节安排第10页
   ·设计目标第10-12页
第二章 垂直搜索引擎相关技术第12-22页
   ·垂直搜索引擎的介绍及探究第12-14页
     ·垂直搜索的概述第12页
     ·垂直搜索引擎和通用搜索引擎的异同点第12-13页
     ·垂直搜索引擎的构成第13-14页
   ·网络爬虫技术第14-19页
     ·Heritrix网络爬虫的概述第14-15页
     ·网络爬虫的工作原理第15页
     ·网络爬虫的抓取工作策略第15-18页
     ·Heritrix网络爬虫工具的应用优势第18页
     ·网络爬虫的注意事项第18-19页
   ·信息提取技术第19页
     ·信息提取技术概述第19页
     ·信息提取技术第19页
   ·中文分词技术第19-21页
     ·中文分词概述第20页
     ·中文分词相关技术第20-21页
   ·全文索引技术第21-22页
     ·全文索引技术概述第21页
     ·全文索引技术方法第21-22页
第三章 全文搜索引擎LUCENE第22-30页
   ·全文搜索引擎LUCENE简介第22页
   ·LUCENE框架组成和优势第22-24页
   ·LUCENE的索引第24-28页
     ·Lucene的逻辑结构第24-25页
     ·Lucene的物理结构第25页
     ·Lucene索引的创立第25-27页
     ·索引的合并与优化第27-28页
   ·LUCENE的搜索第28-29页
     ·Lucene搜索的创建第28页
     ·Lucene对搜索结果的评分和排序第28-29页
   ·小结第29-30页
第四章 图书垂直搜索引擎系统分析第30-36页
   ·需求分析第30-34页
     ·需求背景第30页
     ·业务流程第30-31页
     ·数据流动过程第31页
     ·功能分析第31-32页
     ·数据分析第32-33页
     ·状态转换图第33-34页
   ·系统环境分析第34页
   ·系统性能分析第34-36页
第五章 图书信息垂直搜索引擎的设计第36-42页
   ·垂直搜索引擎系统的设计第36-37页
     ·系统功能概述第36页
     ·系统功能设计第36-37页
   ·设计爬虫模块第37-39页
     ·爬虫的设计思想第37页
     ·确定爬虫清单第37-39页
   ·建立信息抽取模块第39-40页
     ·信息抽取模块概述第39页
     ·信息抽取模块的设计思想第39-40页
   ·建立索引和设计数据库第40-42页
     ·建立索引第40页
     ·设计数据库第40-42页
第六章 图书信息垂直搜索引擎的实现第42-48页
   ·抓取图书信息网页第42-43页
   ·抽取网页信息第43页
   ·索引和数据库的建立第43-45页
     ·建立图书信息词库第43页
     ·数据添加第43-44页
     ·构建索引并向索引添加图书信息第44页
     ·图书信息的综合处理第44-45页
   ·建立索引模块第45-48页
     ·管理配置文件和相关类开发设计第45-46页
     ·前台的页面设计第46-48页
结论第48-49页
致谢第49-50页
参考文献第50-52页
攻读硕士学位期间研究成果第52页

论文共52页,点击 下载论文
上一篇:公共资源交易平台的设计与实现
下一篇:中小企业财务管理系统的设计与实现