首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

文本搜索引擎的探究与设计

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-16页
   ·研究背景和目的第9-10页
   ·研究目标第10页
   ·研究现状第10-14页
   ·研究内容第14-15页
   ·小结第15-16页
第二章 总体设计第16-20页
   ·设计概述第16-18页
   ·设计内容第18-19页
   ·小结第19-20页
第三章 分析抓取模块设计第20-29页
   ·站点分析第20-21页
   ·获取种子链接第21-22页
   ·链接抓取第22-28页
     ·Heritrix的介绍第22-24页
     ·Heritrix的二次开发第24-28页
   ·小结第28-29页
第四章 全文信息处理模块设计第29-43页
   ·内容整理格式第29-30页
   ·内容提取和整理第30-37页
     ·网页文件内容提取和整理第30-33页
     ·二进制文件内容提取和整理第33-37页
   ·分词第37-41页
     ·概述第37-38页
     ·中文分词第38-39页
     ·算法简介第39-40页
     ·JE 分词器及其使用第40-41页
   ·小结第41-43页
第五章 索引存储模块设计第43-57页
   ·概述第43-44页
   ·LUCENE第44-48页
     ·简介第44页
     ·体系结构第44-47页
     ·Lucene的核心对象——索引第47-48页
   ·设计思路第48-49页
   ·设计内容第49-55页
     ·Info表设计第50页
     ·InfoClass类设计第50-52页
     ·InfoDocument类设计第52-53页
     ·InfoJDBC类设计第53-54页
     ·InfoIndexer类设计第54页
     ·StoreProcess类设计第54-55页
   ·小结第55-57页
第六章 用户搜索模块设计第57-61页
   ·总体设计第57-58页
   ·核心算法第58-59页
   ·结果排序第59-60页
   ·用户界面第60页
   ·小结第60-61页
第七章 测试第61-65页
   ·测试环境第61页
   ·测试内容第61-64页
   ·小结第64-65页
总结和展望第65-66页
参考文献第66-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:企业战略风险识别及预警软件系统设计与分析
下一篇:基于ITIL的问题管理流程的设计与实现