首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的主题搜索引擎模板的设计与实现

摘要第1-4页
ABSTRACT第4-6页
目录第6-8页
1 绪论第8-12页
   ·引言第8页
   ·选题背景和研究意义第8-10页
     ·选题背景第8-9页
     ·研究意义第9-10页
   ·主要工作和组织结构第10-12页
2 主题搜索引擎概述第12-15页
   ·搜索引擎的分类第12-13页
   ·主题搜索引擎的产生及优点第13-14页
   ·主题搜索引擎举例第14页
   ·本章小结第14-15页
3 开源信息检索工具库Lucene研究第15-28页
   ·Lucene系统的结构组织第15-16页
   ·Lucene的索引机制第16-20页
     ·Lucene索引过程第17页
     ·Lucene索引的数据结构第17-19页
     ·Lucene索引的核心类第19-20页
   ·Lucene的搜索机制第20-23页
     ·Lucene基本搜索流程第20-21页
     ·Lucene搜索分类第21-22页
     ·Lucene搜索的核心类第22-23页
   ·Lucene排序第23-25页
     ·Lucene排序原理第23-24页
     ·Lucene排序计算体系第24-25页
     ·Lucene排序控制方法第25页
   ·Lucene与中文分词第25-27页
     ·中文分词的基本方法第25-26页
     ·Lucene中文分词第26-27页
   ·本章小结第27-28页
4 主题爬行主要技术第28-41页
   ·主题爬行程序介绍第28-30页
   ·文本分类技术第30-33页
     ·文本表示第30页
     ·向量空间模型及TF-IDF权重算法第30-32页
     ·基于特征项所在域的TF-IDF权重算法第32-33页
   ·爬行策略第33-39页
     ·基于网页内容评价的爬行策略第33-35页
     ·基于Web链接结构的爬行策略第35-37页
     ·结合URL锚文件的最优优先爬行策略第37-39页
   ·本章小结第39-41页
5 基于Lucene的主题搜索引擎模板总体设计第41-45页
   ·系统功能和目标第41-42页
   ·系统构成及运行流程第42-43页
   ·系统工具第43-44页
   ·可行性分析第44页
   ·本章小结第44-45页
6 基于Lucene的主题搜索引擎模板详细设计及实现第45-70页
   ·用户引导模块第45-51页
     ·主题训练第45-50页
     ·初始种子站点设定第50-51页
   ·主题爬行模块第51-63页
     ·构造和维护各个URL队列第52-54页
     ·获得网页编码第54页
     ·抓取网页第54-58页
     ·解析网页第58-60页
     ·文档分类器第60-62页
     ·URL分类器第62-63页
   ·索引模块第63-65页
     ·建立索引第63-64页
     ·索引优化与合并第64-65页
   ·查询模块第65-66页
   ·中文分词技术第66-67页
   ·搜索界面设计和实现第67-69页
   ·信息更新第69页
   ·本章小结第69-70页
7 基于Lucene的主题型搜索引擎模板运行与测试第70-77页
   ·系统运行第70页
   ·系统测试第70-73页
   ·系统测试结果第73-75页
   ·不同爬行策略对比试验第75-76页
   ·本章小结第76-77页
8 总结与展望第77-79页
   ·总结第77页
   ·展望第77-79页
参考文献第79-81页
致谢第81-82页
攻读硕士期间发表的学术论文及参加的科研项目第82-83页

论文共83页,点击 下载论文
上一篇:基于服务的开放可重构管理平台的研究与实现
下一篇:基于SURF算法的视频拼接技术研究