首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Java的垂直搜索引擎的设计与实现

摘要第1-6页
ABSTRACT第6-14页
第1章 绪论第14-20页
   ·课题背景第14页
   ·搜索引擎发展历史第14-16页
   ·垂直搜索引擎第16-18页
     ·什么是垂直搜索引擎第16页
     ·垂直搜索引擎发展现状第16-18页
     ·垂直搜索引擎的特点第18页
   ·论文内容第18-20页
第2章 搜索引擎的实现原理第20-36页
   ·搜索引擎工作流程第20-21页
   ·网络蜘蛛程序第21-31页
     ·网络蜘蛛概念第21-22页
     ·网络蜘蛛基本原理第22-26页
     ·网络蜘蛛设计第26-31页
       ·网络蜘蛛应考虑的问题第26-29页
       ·聚焦爬虫设计应考虑的问题第29-31页
   ·网页存储器与分析索引器第31-32页
   ·检索器和用户接口界面第32-33页
     ·检索器第32-33页
     ·用户接口第33页
   ·搜索引擎的页面排序算法第33-36页
     ·PageRank 算法第33-34页
     ·HITS 算法第34-36页
第3章 基于 Lucene 的索引与搜索第36-50页
   ·什么是全文检索第36页
   ·Lucene 全文检索的实现机制(倒排文档)第36-39页
   ·索引的建立第39-44页
     ·索引工具IndexWriter第41-42页
     ·Lucene 索引的建立过程第42-43页
     ·索引的合并、优化及同步第43-44页
   ·Lucene 的搜索第44-47页
     ·使用IndexSearcher 进行搜索第44-45页
     ·对搜索结果的评分、排序第45-46页
     ·Lucene 的分析器第46-47页
   ·中文切分词机制第47-50页
     ·什么是中文分词第47-48页
     ·中文分词技术第48-49页
     ·本文采用的中文分词第49-50页
第4章 网络爬虫 Heritrix第50-66页
   ·Heritrix 的下载与使用第50-56页
     ·Heritrix 简介第50页
     ·在Eclipse 里配置Heritrix 的开发环境第50-53页
     ·创建一个抓取任务第53-56页
   ·Heritrix 的架构第56-59页
   ·Heritrix 扩展接口第59-66页
第5章 手机产品垂直搜索引擎的设计与分析第66-78页
   ·基本功能需求第66页
   ·系统的体系结构和实现思路第66-76页
     ·系统的构建平台第66-67页
     ·系统的总体结构第67-68页
     ·手机网页信息的抓取思路第68-72页
     ·网页的结构化抽取思路第72-76页
       ·思路描述第72-74页
       ·抽取工具简介第74-76页
     ·索引的建立第76页
   ·系统的数据库设计第76-78页
第6章 构建手机产品垂直搜索引擎第78-106页
   ·手机产品网页的抓取第78-81页
   ·网页的处理第81-89页
   ·建立索引、数据库第89-99页
     ·构建产品信息词库第89页
     ·对数据库和索引操作第89-99页
   ·系统的用户界面第99-106页
     ·系统后台部分的实现第99-103页
     ·系统前台页面第103-106页
结论第106-108页
参考文献第108-111页
致谢第111-112页
作者简介及读研期间主要科研成果第112-113页

论文共113页,点击 下载论文
上一篇:指纹识别技术在电子商务安全认证中的应用与研究
下一篇:MIS的管理组件设计及在煤矿安全管理系统中的应用