首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎中关键技术的研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-11页
   ·研究背景第7页
   ·搜索引擎的发展状况第7-8页
   ·搜索引擎的基本工作原理第8页
   ·垂直搜索引擎在国内外发展现状第8-9页
     ·垂直搜索引擎的发展过程第8-9页
     ·垂直搜索引擎的未来发展方向第9页
   ·本文章节安排第9-11页
第二章 垂直搜索引擎的相关理论第11-16页
   ·垂直搜索引擎的概念及与通用搜索引擎的区别第11页
   ·垂直搜索引擎性能优劣的评价准则第11-12页
   ·垂直搜索引擎的各模块功能第12-14页
   ·主题爬虫简介第14-15页
     ·主题爬虫的基础理论第14页
     ·主题爬虫的系统结构第14-15页
   ·小结第15-16页
第三章 垂直搜索引擎核心技术的研究第16-33页
   ·主题搜索研究第16-19页
     ·基于内容评价的搜索策略第16-17页
     ·基于链接结构的搜索策略第17-19页
   ·开源网络爬虫Heritrix第19-22页
     ·Heritrix体系结构第19-20页
     ·Heritrix定向抓取的改进第20-22页
   ·网页分析提取技术第22-24页
     ·JDK正则表达式第22-23页
     ·HTMLParser解析工具第23-24页
   ·中文分词技术第24-28页
     ·基于词典匹配字符串的分词算法第24-25页
     ·基于词频统计的分词算法第25-26页
     ·基于理解的分词算法第26-27页
     ·基于JE的分词算法改进第27-28页
   ·Lucene全文检索引擎第28-32页
     ·简介第28-29页
     ·Lucene几个主要索引文件第29页
     ·Lucene的索引过程第29-31页
     ·Lucene的检索机制及查询流程第31-32页
   ·小结第32-33页
第四章 面向体育用品的垂直搜索引擎系统设计第33-37页
   ·系统需求第33-34页
   ·系统体系结构设计第34-35页
   ·系统功能设计第35页
   ·硬件基础和软件开发环境第35-36页
   ·小结第36-37页
第五章 面向体育用品的垂直搜索系统实现第37-45页
   ·Heritrix爬虫抓取实验第37-38页
   ·体育用品信息结构化提取实验第38页
   ·中文分词改进测试第38-39页
   ·数据存储组织及索引库第39-41页
     ·数据库结构第39页
     ·Lucene索引构建与检索的实现第39-40页
     ·用户查询接口第40-41页
   ·系统测试与验证第41-44页
   ·小结第44-45页
第六章 总结与展望第45-47页
参考文献第47-50页
致谢第50-51页
作者简介第51页
攻读硕士学位期间研究成果第51页

论文共51页,点击 下载论文
上一篇:基于软开关技术的PWM变换器的研究与设计
下一篇:基于双目立体视觉的三维重建系统研究