首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎中主题爬虫搜索策略研究与实现

摘要第1-5页
Abstract第5-10页
第一章 绪论第10-16页
   ·课题的研究背景和意义第10-11页
   ·垂直搜索引擎概述第11-15页
     ·垂直搜索引擎的发展现状及发展前景第11-13页
     ·搜索引擎的工作原理第13-15页
   ·本文的主要工作和组织结构第15-16页
第二章 主题爬虫简介第16-24页
   ·主题爬虫的研究现状第16-17页
   ·主题爬虫的概念第17页
   ·主题爬虫的系统结构第17-18页
   ·主题爬虫的工作流程第18-20页
   ·主题爬虫的目标第20页
   ·开源网络爬虫实例第20-22页
   ·本章小结第22-24页
第三章 主题爬虫的搜索策略第24-40页
   ·基于文本内容的搜索策略第24-32页
     ·主题信息在Web页面中的分布特点第24-25页
     ·主题描述第25-26页
     ·关键词的抽取第26-27页
     ·主题相关度计算第27-29页
     ·关键字的权重计算第29-30页
     ·改进的TF-IDF算法第30页
     ·基于文本内容的搜索算法第30-32页
   ·基于超链接分析的搜索策略第32-35页
     ·PageRank算法第32-33页
     ·HITS算法第33-34页
     ·PageRank算法和HITS算法的比较第34-35页
     ·改进的HITS算法第35页
   ·基于未来回报的搜索策略第35-36页
     ·基于巩固学习的搜索策略第36页
     ·基于语境图的搜索策略第36页
   ·基于内容和链接的综合搜索策略第36-38页
   ·本章小结第38-40页
第四章 基于内容和链接综合搜索的主题爬虫的系统实现第40-50页
   ·系统的设计原则第40-41页
     ·系统稳定第40页
     ·主题相关性第40页
     ·抓取效率高第40页
     ·人性化操作第40-41页
   ·系统需求分析第41页
   ·主题爬虫的系统结构第41-47页
     ·选取初始URL第42-43页
     ·网页下载第43-45页
     ·网页解析第45-46页
     ·页面主题相关度的计算第46-47页
     ·URL主题预测第47页
   ·系统性能分析第47-48页
   ·本章小结第48-50页
第五章 结论第50-52页
   ·结论第50页
   ·展望第50-52页
参考文献第52-54页
附录第54-60页
作者简介第60页
作者在攻读硕士学位期间发表的学术论文第60-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:分布式系统混合任务实时容错调度算法研究
下一篇:虚拟现实技术在商场服装展销中的探讨与研究