首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎中聚焦爬虫技术的研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-15页
   ·课题研究背景第10-11页
   ·国内外研究现状第11-13页
     ·搜索引擎发展介绍第11-12页
     ·聚焦爬虫研究现状第12-13页
   ·本文主要工作第13-15页
     ·论文的主要研究内容第13页
     ·论文的组织结构安排第13-15页
第2章 面向主题的聚焦爬虫原理及关键技术第15-29页
   ·垂直搜索引擎的基本原理第15-17页
     ·垂直搜索引擎的系统架构第15-16页
     ·垂直搜索引擎的基本工作流程第16-17页
   ·聚焦爬虫的基本原理与结构第17-21页
     ·Web 信息提取器第18-19页
     ·网页去重检测器第19-20页
     ·网页分析控制器第20页
     ·URL 处理器第20-21页
   ·主题 Web 页面分布特性第21-22页
     ·Hub 特征第21页
     ·Linkage/Sibling Locality 特征第21-22页
     ·站点主题聚集特征第22页
     ·Tunnel 特征第22页
   ·主题相关性判别算法研究第22-28页
     ·基于元数据的判别第22-23页
     ·基于链接标签数据的判别第23-24页
     ·基于链接结构分析的判别第24-26页
     ·基于页面语义信息的判别第26-28页
   ·本章小结第28-29页
第3章 基于立即价值的自适应免疫爬行策略研究第29-38页
   ·聚焦爬虫的爬行策略第29页
   ·网页的主题相关度评价方法第29-33页
     ·页面内容相关度计算第29-31页
     ·链接结构重要度计算第31-32页
     ·网页主题相关度评价方法第32-33页
   ·基于立即价值的自适应免疫聚焦爬行策略第33-37页
     ·自适应免疫算法第33-35页
     ·免疫算法参数的自适应调节第35页
     ·自适应免疫算法爬行流程第35-36页
     ·算法实验仿真第36-37页
   ·本章小结第37-38页
第4章 基于立即价值和未来价值的智能爬行策略研究第38-47页
   ·基于立即值和未来值回报的爬行原理第38-39页
     ·算法思想第39页
     ·算法相关定义第39页
   ·量子行为进化算法研究第39-44页
     ·权重值的自适应调节第40-43页
     ·QBEA 算法流程第43-44页
   ·基于量子行为进化算法的聚焦爬行策略第44-45页
     ·适应度函数选取第44页
     ·量子行为进化算法的聚焦爬行策略流程第44-45页
   ·算法实验仿真第45-46页
   ·本章小结第46-47页
第5章 聚焦爬虫原型系统的设计与实现第47-54页
   ·体系结构及设计目标第47-48页
   ·系统开发及运行环境第48页
   ·系统功能介绍及实现第48-52页
     ·系统功能介绍第48-50页
     ·系统功能实现第50-52页
   ·本章小结第52-54页
结论第54-56页
参考文献第56-60页
攻读硕士学位期间发表的论文和取得的科研成果第60-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:缓存替换策略研究
下一篇:基于条件随机场的人体行为识别与理解