首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Java技术的搜索引擎研究与实现

第1章 绪论第1-15页
   ·概述第9页
   ·搜索引擎的现状第9-13页
     ·搜索引擎的发展历史第9-10页
     ·搜索引擎的分类第10-12页
     ·当前主流搜索引擎简介第12-13页
   ·本文研究的主要内容第13-15页
第2章 基本组成及数据结构第15-28页
   ·基本组成及工作流程第16-18页
   ·存储结构第18-23页
     ·页面存储库第18-19页
     ·词典库第19-20页
     ·Hits列表第20-23页
   ·索引结构第23-28页
     ·文档索引库第24-25页
     ·前向索引表第25-26页
     ·后向索引表第26-28页
第3章 网页抓取技术第28-39页
   ·抓取技术的协议分析第28-31页
     ·通信协议第28-30页
     ·HTML解析第30-31页
   ·网页抓取方法第31-34页
   ·网页抓取应考虑的问题第34-39页
     ·抓取周期分析第34-35页
     ·抓取内容分析第35-36页
     ·网络蜘蛛的排斥机制第36-39页
第4章 索引技术及搜索第39-50页
   ·网页内容分析第39-43页
     ·什么是中文分词第39-40页
     ·中文分词技术第40-41页
     ·索引的建立第41-43页
   ·页面优先度算法第43-47页
     ·基于链接分析的算法第43-46页
     ·基于网页内容的算法第46-47页
   ·搜索及结果排序第47-50页
第5章 搜索引擎的软件实现第50-74页
   ·软件开发环境第50-56页
     ·Java的Internet连接技术第50-51页
     ·Java中的中文处理第51-53页
     ·Java的多线程机制第53-55页
     ·JDBC应用第55-56页
   ·网络蜘蛛的实现第56-59页
   ·利用LUCENE实现索引和搜索第59-74页
     ·Lucene的核心类第61-64页
     ·利用Lucene实现索引和搜索第64-74页
结论第74-77页
致谢第77-78页
参考文献第78-82页
攻读硕士学位期间发表的论文第82页

论文共82页,点击 下载论文
上一篇:GNSS双模接收机解算算法实现
下一篇:支持向量机改进方法在光谱定量分析中的应用