首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的网络文学垂直搜索引擎的研究与实现

摘要第1-6页
ABSTRACT第6-9页
第1章 绪论第9-13页
   ·选题背景及意义第9-10页
   ·垂直搜素引擎的优势第10-11页
   ·国内外垂直搜索引擎发展现状第11页
   ·本文的结构安排第11-13页
第2章 垂直搜索引擎的工作原理及相关技术第13-25页
   ·垂直搜索引擎工作原理第13-16页
     ·主题蜘蛛与主题相关度算法第13-15页
     ·页面分析与索引器第15页
     ·检索器和用户接口第15-16页
     ·搜索引擎的性能指标第16页
   ·Heritrix基础第16-19页
     ·Heritrix框架第16-17页
     ·Web管理控制台第17-18页
     ·CrawlOrder第18页
     ·CrawlController第18-19页
   ·Lucene基础第19-22页
     ·Lucene总体架构第19-20页
     ·Lucene索引技术第20-22页
   ·相关技术第22-24页
     ·页面相关度算法第22-23页
     ·网页信息结构化抽取第23页
     ·中文分词第23-24页
   ·本章小结第24-25页
第3章 网络文学垂直搜索引擎系统的框架与设计第25-42页
   ·系统的总框架设计第25-28页
     ·网络文学现状第25-26页
     ·基本功能第26页
     ·性能要求第26-27页
     ·系统总体框架第27-28页
   ·系统模块分析第28-33页
     ·主题蜘蛛模块第28-30页
     ·页面分析模块第30-31页
     ·索引模块第31-32页
     ·检索模块第32-33页
   ·系统的用例图第33-34页
   ·系统模块之间的交互第34-36页
   ·数据库第36-38页
     ·数据库的选择和设计原则第36页
     ·数据库操作模块第36-37页
     ·数据库表格第37-38页
   ·Lucene搜索结果排序算法的改进第38-41页
     ·Lucene默认排序算法第38-39页
     ·Lucene排序算法的改进第39-40页
     ·网络文学作品摘要信息长度研究第40-41页
   ·本章小结第41-42页
第4章 网络文学垂直搜索引擎系统的实现第42-63页
   ·开发平台第42页
   ·搜索引擎数据的采集第42-45页
     ·基于链接标记数据的主题预测算法的实现第42-43页
     ·实现Heritrix多线程爬取第43-44页
     ·Heritrix采集页面任务配置第44-45页
   ·页面解析模块的实现第45-47页
   ·索引模块的实现第47-50页
     ·索引流程第47-49页
     ·索引的优化第49-50页
   ·检索模块的实现第50-54页
     ·检索流程第50-52页
     ·检索结果的缓存第52-54页
   ·Lucene改进算法的实现第54-57页
     ·基于内容的页面相关度算法的实现第54页
     ·作品重要性加分的实现第54-56页
     ·DirectHit算法的实现第56-57页
   ·用户查询接口第57-58页
   ·系统性能测试第58-62页
     ·查全率测试第58-59页
     ·查准率测试第59-60页
     ·检索时间测试第60-62页
   ·本章小结第62-63页
第5章 结论与展望第63-65页
   ·结论第63页
   ·展望第63-65页
参考文献第65-67页
致谢第67-68页
攻读学位期间参加的科研项目和成果第68页

论文共68页,点击 下载论文
上一篇:移动交互机制的流程型协同OA系统研究
下一篇:导航路径的二维流型分层检索算法研究