首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene和Heritrix的职位垂直搜索引擎的设计与实现

摘要第1-6页
Abstract第6-9页
第一章 引言第9-17页
   ·课题背景第9-10页
   ·课题意义第10页
   ·通用搜索引擎第10-14页
     ·搜索引擎的工作原理第10-11页
     ·搜索引擎发展史第11-12页
     ·搜索引擎发展趋势第12-13页
     ·搜索引擎分类第13-14页
   ·垂直搜索引擎第14-17页
     ·什么是垂直搜索引擎第14页
     ·传统搜索引擎和垂直搜索引擎的区别第14-16页
     ·垂直搜索引擎国内外现状第16-17页
第二章 垂直搜索引擎理论与技术第17-26页
   ·信息采集技术第17-21页
     ·基本工作原理第17-19页
     ·抓取策略第19-20页
     ·垂直搜索中的信息采集第20-21页
   ·信息提取技术第21-23页
     ·信息提取介绍第21页
     ·信息提取方法第21-22页
     ·信息提取相关技术第22-23页
   ·中文分词技术第23-26页
     ·中文分词介绍第23-24页
     ·中文分词相关技术第24-26页
第三章 本系统用到的相关技术第26-43页
   ·MDA 简介第26-28页
     ·MDA 开发程序第26-27页
     ·MDA 整体框架第27-28页
   ·LUCENE 简介第28-34页
     ·Lucene 组织结构第28-29页
     ·Lucene 索引文件结构第29-31页
     ·核心的索引类第31-32页
     ·核心的搜索类第32页
     ·Lucene 的全文检索第32-34页
   ·HERITRIX 简介第34-38页
     ·Heritrix 工作原理第34-35页
     ·Heritrix 组织结构第35-38页
   ·HTMLPARSER 简介第38-43页
     ·HTMLParser 的主要作用第38-39页
     ·HTMLParser 中数据结构第39-40页
     ·HTMLParser 访问内容第40-43页
第四章 垂直搜索引擎设计与实现第43-78页
   ·系统总体需求分析和设计第43-44页
   ·爬虫模块的设计实现第44-52页
   ·信息抽取模块的设计实现第52-60页
   ·索引模块的设计实现第60-70页
   ·搜索模块的设计实现第70-78页
第五章 总结和展望第78-79页
致谢第79-80页
参考文献第80-81页

论文共81页,点击 下载论文
上一篇:管网信息系统编辑模块的实现
下一篇:数字水印技术在数字版区域地质图上的应用