首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

用户可配置的搜索引擎的设计与实现

摘要第1-5页
Abstract第5-8页
第一章 绪论第8-11页
   ·课题研究背景及意义第8页
   ·国内外研究现状第8-9页
   ·论文的主要研究工作第9-10页
   ·论文的组织结构第10-11页
第二章 搜索引擎综合研究第11-25页
   ·搜索引擎的发展历史第11-13页
   ·现有通用搜索引擎存在的问题第13页
   ·现有搜索引擎相关技术简介第13-24页
     ·全文检索系统第13-14页
     ·网络爬虫第14-16页
     ·搜索引擎索引第16-19页
       ·中文分词第16-17页
       ·倒排索引第17-19页
     ·检索与排序算法第19-24页
       ·信息检索基本原理第19-20页
       ·向量空间模型第20-22页
       ·TF*IDF 算法第22-23页
       ·PageRank 排序算法第23-24页
   ·本章小结第24-25页
第三章 用户可配置的搜索引擎总体设计第25-43页
   ·可配置搜索引擎总体功能第25-26页
   ·可配置搜索引擎总体系统架构第26-28页
   ·可配置搜索引擎底层框架剖析第28-30页
   ·可配置搜索引擎总体功能模块设计第30-41页
     ·原型系统爬虫模块概要设计第31-32页
     ·原型系统预处理模块概要设计第32-35页
       ·源数据分析第32-33页
       ·结构化数据模型的建立第33-34页
       ·MD5算法生成摘要文件名第34-35页
     ·原型系统索引模块概要设计第35-39页
       ·系统中文分词设计第35-37页
       ·数据库设计与索引文件数据结构第37-39页
     ·原型系统检索模块概要设计第39-41页
       ·可配置检索模块总体功能设计第39-40页
       ·用户配置参数的数据结构设计第40-41页
   ·本章小结第41-43页
第四章 用户可配置的搜索引擎的详细设计第43-63页
   ·可配置搜索引擎爬虫模块的详细设计第43-49页
     ·爬虫启动与种子站点设置第43-44页
     ·Heritrix 功能参数的配置与网络资源获取第44-47页
     ·爬虫返回信息存储结构第47-49页
   ·可配置搜索引擎预处理模块的详细设计第49-52页
     ·Page 模型建立第50页
     ·HTMLPaser 组件遍历网页节点第50-51页
     ·配置文件的设置第51-52页
     ·预处理架构测试类第52页
   ·可配置搜索引擎索引模块的详细设计第52-55页
     ·分词算法的详细设计第52-53页
     ·数据库与索引的详细设计第53-55页
   ·可配置搜索引擎检索模块的详细设计第55-61页
     ·检索模块基础查询架构算法设计第55-57页
     ·可配置查询扩展功能算法详细设计第57-61页
       ·用户配置参数的数据结构详细设计第57-58页
       ·查询扩展算法设计第58-61页
   ·本章小结第61-63页
第五章 搜索引擎原型系统的实现与测试第63-81页
   ·爬虫模块的实现第63-64页
   ·预处理模块的实现第64-68页
   ·索引模块的实现第68-70页
   ·用户可配置搜索引擎检索的实现第70-80页
     ·原型系统整体架构的实现第70-72页
     ·可配置查询扩展检索功能的实现第72-80页
   ·本章小结第80-81页
第六章 总结与展望第81-83页
   ·工作总结第81页
   ·进一步的工作第81-83页
致谢第83-84页
参考文献第84-86页

论文共86页,点击 下载论文
上一篇:基于自动生成XML的动态图形界面设计与实现
下一篇:基于J2EE的音乐论坛挖掘