基于Java的垂直搜索引擎的设计与实现

摘要	第1-6页
ABSTRACT	第6-14页
第1章绪论	第14-20页
·课题背景	第14页
·搜索引擎发展历史	第14-16页
·垂直搜索引擎	第16-18页
·什么是垂直搜索引擎	第16页
·垂直搜索引擎发展现状	第16-18页
·垂直搜索引擎的特点	第18页
·论文内容	第18-20页
第2章搜索引擎的实现原理	第20-36页
·搜索引擎工作流程	第20-21页
·网络蜘蛛程序	第21-31页
·网络蜘蛛概念	第21-22页
·网络蜘蛛基本原理	第22-26页
·网络蜘蛛设计	第26-31页
·网络蜘蛛应考虑的问题	第26-29页
·聚焦爬虫设计应考虑的问题	第29-31页
·网页存储器与分析索引器	第31-32页
·检索器和用户接口界面	第32-33页
·检索器	第32-33页
·用户接口	第33页
·搜索引擎的页面排序算法	第33-36页
·PageRank 算法	第33-34页
·HITS 算法	第34-36页
第3章基于 Lucene 的索引与搜索	第36-50页
·什么是全文检索	第36页
·Lucene 全文检索的实现机制(倒排文档)	第36-39页
·索引的建立	第39-44页
·索引工具IndexWriter	第41-42页
·Lucene 索引的建立过程	第42-43页
·索引的合并、优化及同步	第43-44页
·Lucene 的搜索	第44-47页
·使用IndexSearcher 进行搜索	第44-45页
·对搜索结果的评分、排序	第45-46页
·Lucene 的分析器	第46-47页
·中文切分词机制	第47-50页
·什么是中文分词	第47-48页
·中文分词技术	第48-49页
·本文采用的中文分词	第49-50页
第4章网络爬虫 Heritrix	第50-66页
·Heritrix 的下载与使用	第50-56页
·Heritrix 简介	第50页
·在Eclipse 里配置Heritrix 的开发环境	第50-53页
·创建一个抓取任务	第53-56页
·Heritrix 的架构	第56-59页
·Heritrix 扩展接口	第59-66页
第5章手机产品垂直搜索引擎的设计与分析	第66-78页
·基本功能需求	第66页
·系统的体系结构和实现思路	第66-76页
·系统的构建平台	第66-67页
·系统的总体结构	第67-68页
·手机网页信息的抓取思路	第68-72页
·网页的结构化抽取思路	第72-76页
·思路描述	第72-74页
·抽取工具简介	第74-76页
·索引的建立	第76页
·系统的数据库设计	第76-78页
第6章构建手机产品垂直搜索引擎	第78-106页
·手机产品网页的抓取	第78-81页
·网页的处理	第81-89页
·建立索引、数据库	第89-99页
·构建产品信息词库	第89页
·对数据库和索引操作	第89-99页
·系统的用户界面	第99-106页
·系统后台部分的实现	第99-103页
·系统前台页面	第103-106页
结论	第106-108页
参考文献	第108-111页
致谢	第111-112页
作者简介及读研期间主要科研成果	第112-113页