首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于CLucene和Larbin的企业搜索引擎的研究与实现

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-15页
   ·课题研究背景及意义第10-11页
   ·企业搜索引擎研究现状第11-12页
   ·课题研究内容及成果第12-14页
   ·论文的组织结构第14-15页
第二章 搜索引擎概述第15-23页
   ·搜索引擎的发展历史第15-16页
   ·搜索引擎的工作原理第16-19页
   ·搜索引擎的分类第19-20页
   ·搜索引擎的发展趋势第20-23页
第三章 相关技术研究第23-44页
   ·全文检索系统概述第23-27页
     ·全文检索定义第23-24页
     ·全文检索方法第24-26页
     ·全文检索技术的不足第26-27页
   ·中文分词技术概述第27-32页
     ·中文分词定义第27-28页
     ·中文分词的分类第28-29页
     ·中文分词的难点问题第29-30页
     ·中文分词的评价标准第30-31页
     ·几种中文分词系统的介绍第31-32页
   ·网络爬虫概述第32-36页
     ·HTTP 协议简介第32-33页
     ·网络爬虫的爬取策略第33-34页
     ·网络爬虫的搜索策略第34页
     ·网络爬虫的工作流程第34-36页
   ·Larbin 的研究第36-40页
     ·Larbin 的设计原理第36-37页
     ·Larbin 的工作流程第37-38页
     ·Larbin 的URL 调度第38-39页
     ·Larbin 关键类的介绍第39-40页
   ·Lucene 与CLucene 的研究第40-44页
     ·Lucene 与CLucene 的介绍第40-41页
     ·Lucene 的系统结构第41-44页
第四章 中文分词算法的设计与实现第44-55页
   ·中文分词模块总体框架第44-45页
   ·词典组织第45-47页
   ·同义词词库第47-48页
   ·逆向最大匹配算法第48-50页
   ·专业领域分词算法第50-52页
   ·分词系统的类的设计第52-53页
   ·实验描述第53-55页
第五章 基于CLucene 和Larbin 的企业搜索引擎的设计与实现第55-70页
   ·系统总体结构设计第55-56页
   ·网络爬虫模块的设计与实现第56-62页
     ·选择种子URL第57-58页
     ·页面登录第58-59页
     ·页面保存第59-60页
     ·URL 过滤第60-61页
     ·网页消噪第61-62页
   ·索引模块的设计与实现第62-66页
     ·CLucene 的索引结构第63-64页
     ·分词模块的设计第64-66页
   ·查询展示模块的设计与实现第66-68页
     ·查询展示模块的工作流程第66-67页
     ·查询展示模块的类的设计第67-68页
   ·系统运行效果第68-70页
结束语第70-71页
   ·全文总结第70页
   ·下一步工作第70-71页
致谢第71-72页
参考文献第72-74页
攻硕期间取得的研究成果第74-75页

论文共75页,点击 下载论文
上一篇:两类自动机的乘积研究
下一篇:大规模人群行为仿真模型的研究与实现