首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于爬虫的Sohu新闻搜索引擎设计与实现

摘要第1-5页
Abstract第5-8页
第一章 绪论第8-11页
   ·搜索引擎的研究现状与发展趋势第8-10页
   ·论文的主要研究内容第10-11页
第二章 相关技术介绍第11-16页
   ·搜索引擎系统开发存在的问题及其解决方法第11页
   ·本系统使用的主要开源软件第11-16页
第三章 系统需求和设计目标第16-19页
   ·系统定位与目标第16页
   ·系统功能需求第16-19页
第四章 系统框架和基本流程第19-24页
   ·系统框架与体系结构第19-22页
   ·基本流程第22-24页
第五章 模块设计与实现第24-39页
   ·Heritrix 数据抓取模块的实现第24-29页
   ·HTMLParser 数据预处理模块第29-31页
   ·新闻页面 Lucene 索引与 Oracle 数据库数据生成模块第31-36页
   ·Lucene 搜索核心处理模块第36-39页
第六章 系统关键技术分析与实现第39-57页
   ·Lucene 默认排序算法分析第39-41页
   ·PageRank 算法分析第41-42页
   ·改进的排序算法设计第42-44页
   ·改进的排序算法的实现第44-54页
   ·改进算法的效果测试第54-57页
第七章 总结与展望第57-58页
参考文献第58-60页

论文共60页,点击 下载论文
上一篇:对Struts+Hibernate架构的研究和实现
下一篇:基于等级保护的党校网络安全体系的研究与应用