首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向汽车主题的垂直搜索引擎研究与实现

摘要第1-7页
Abstract第7-10页
第1章 绪论第10-15页
   ·研究背景第10页
   ·搜索引擎的发展历史第10-11页
   ·垂直搜索引擎的特点第11-12页
   ·垂直搜索引擎国内外研究现状第12-13页
   ·论文主要研究内容第13-14页
   ·论文章节安排第14-15页
第2章 相关理论与Heritrix技术剖析第15-22页
   ·垂直搜索引擎工作原理第15-16页
   ·Heritrix系统架构第16-19页
     ·Heritrix项目简介第16页
     ·Heritrix系统结构第16-19页
   ·Heritrix的扩展与改进第19-21页
     ·设计解析特定网站的解析器Extractor第19页
     ·扩展FrontierScheduler来抓取特定内容第19页
     ·消除robots.txt对个别Processor的影响第19-20页
     ·扩展Queue-assignment-policy实现多线程抓取第20-21页
   ·本章小结第21-22页
第3章 全文检索引擎Lucene剖析第22-30页
   ·Lucene概述第22-24页
     ·Lucene项目简介第22页
     ·Lucene系统结构第22-24页
   ·Lucene索引技术第24-26页
     ·Lucene倒排索引技术第24-25页
     ·Lucene索引结构第25-26页
   ·Lucene排序技术第26-29页
     ·传统检索排序技术第26页
     ·Lucene基础排序算法第26-27页
     ·排序算法的改进第27-29页
   ·本章小结第29-30页
第4章 垂直搜索引擎的设计与实现第30-56页
   ·用户的一般要求第30页
   ·垂直搜索引擎总体系统架构第30-32页
   ·爬虫子系统的设计与实现第32-37页
     ·网络爬虫Heritrix的改进与扩展第32-37页
   ·解析子系统的设计与实现第37-43页
   ·索引子系统的设计与实现第43-48页
     ·确定数据库结构和索引结构第44页
     ·对索引进行操作第44-45页
     ·建立词库第45-48页
   ·查询子系统的设计与实现第48-55页
     ·查询子系统的设计第48-53页
     ·改进排序算法的实现第53-55页
   ·本章小结第55-56页
第5章 系统测试第56-64页
   ·垂直搜素引擎相对通用搜索引擎的直观优势第56-58页
   ·爬虫测试第58-61页
     ·爬虫测试1第58-59页
     ·爬虫测试2第59-61页
   ·排序算法改进前后的排序结果分析第61-63页
   ·本章小结第63-64页
总结与展望第64-65页
致谢第65-66页
参考文献第66-70页
附录1第70-76页
附录2第76-78页
附录3第78-79页
附录4第79-84页
附录5第84-86页
附录6第86-91页
攻读硕士学位期间发表的论文第91-92页

论文共92页,点击 下载论文
上一篇:基于Web的高校网络教学系统的设计与实现
下一篇:基于SSH2的企业人事管理系统研究与实现