首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene/HttpClient的垂直搜索引擎研究与实现

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-15页
   ·课题研究背景第7-8页
   ·搜索引擎发展历史第8-9页
   ·垂直搜索引擎第9-12页
     ·垂直搜索引擎的概念第9-10页
     ·垂直搜索引擎国内外发展现状第10-11页
     ·垂直搜索引擎的特点第11-12页
   ·本文工作与组织结构第12-15页
     ·本文主要工作第12页
     ·论文组织结构第12-15页
第二章 垂直搜索引擎的相关理论第15-23页
   ·网络爬虫第15-18页
     ·网络爬虫工作原理第15-16页
     ·网络爬虫的策略第16-18页
   ·页面解析与中文分词第18-21页
     ·页面解析第18-19页
     ·中文分词第19-21页
   ·垂直搜索引擎的工作原理第21页
   ·小结第21-23页
第三章 索引检索框架LUCENE的分析研究第23-37页
   ·LUCENE的用途第23页
   ·LUCENE的发展现状与优点第23-25页
     ·Lucene的历史第23-24页
     ·Lucene的现状第24页
     ·Lucene的优点第24-25页
   ·LUCENE的索引机制第25-33页
     ·创建索引的动机第25页
     ·Lucene采用的索引机制——倒排索引第25-26页
     ·Lucene建立索引第26-31页
     ·索引合并与优化第31-33页
   ·LUCENE的搜索机制第33-36页
     ·基于IndexSearcher的搜索第33-34页
     ·Lucene对搜索结果的评分、排序第34-36页
   ·小结第36-37页
第四章 垂直搜索引擎的设计与实现第37-57页
   ·系统总体设计思路第37-38页
     ·系统构建环境第37页
     ·系统总体结构第37-38页
   ·信息采集子系统的实现第38-43页
     ·信息采集主网站的选择第38页
     ·基于DeepWeb/HttpClient的数据抓取第38-43页
     ·页面解析第43页
   ·关键字提取第43-47页
     ·文本预处理第43-44页
     ·中文分词第44页
     ·基于TFIDF的关键字提取第44-46页
     ·关键词提取整体流程第46-47页
   ·基于LUCENE的索引子系统的实现第47-51页
     ·中文分词分析器第47-49页
     ·基于Lucene的索引构建第49-51页
   ·检索子系统的设计与实现第51-55页
     ·系统后台部分实现第51-53页
     ·系统前台部分实现第53-54页
     ·系统测试第54-55页
   ·小结第55-57页
第五章 总结与展望第57-59页
   ·论文总结第57页
   ·下一步工作展望第57-59页
致谢第59-61页
参考文献第61-65页
攻读硕士学位期间研究成果第65-66页

论文共66页,点击 下载论文
上一篇:基于中文分词检索技术的企业名称查重系统的研究
下一篇:基于虚拟现实的铁路机车乘务员培训系统的设计与实现