首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

垂直搜索引擎数据采集技术的研究与实现

摘要第1页
ABSTRACT第3-6页
第一章 引言第6-9页
   ·选题背景及意义第6-7页
   ·国内外研究现状第7-8页
   ·本文的工作与创新第8-9页
第二章 搜索引擎概述第9-14页
   ·搜索引擎的分类第9页
     ·通用搜索引擎第9页
     ·目录搜索引擎第9页
     ·元搜索引擎第9页
   ·垂直搜索引擎第9-12页
     ·垂直搜索引擎的出现第9-10页
     ·垂直搜索引擎的特点第10-11页
     ·面向主题的数据采集第11-12页
   ·搜索引擎的工作原理第12-14页
第三章 系统的总体设计第14-18页
   ·搜索引擎的系统结构第14-15页
   ·数据采集系统的系统结构第15-16页
     ·信息获取器第16页
     ·网页去重器第16页
     ·URL 抽取器第16页
     ·数据存储模块第16页
   ·面临的主要问题及对策第16-17页
   ·系统设计目标第17-18页
第四章 系统搜索策略的研究第18-28页
   ·基于内容评价的搜索策略第18-21页
     ·Fish Search 算法第18-19页
     ·Shark Search 算法第19-21页
   ·基于链结构特征的搜索策略第21-28页
     ·主题页面的分布特征第22-24页
     ·PageRank 算法第24-25页
     ·HITS 算法第25-27页
     ·PageRank 与HITS 算法的比较第27-28页
第五章 系统的设计与实现第28-42页
   ·robot 协议处理第28-29页
   ·链接处理模块第29-34页
     ·超链接的抽取第29-30页
     ·无效链接的过滤第30页
     ·链接的评价与选择第30-33页
     ·基于散列技术的去重策略第33-34页
   ·页面处理模块第34-39页
     ·页面的评价与过滤第34-37页
     ·页面的去重策略第37-38页
     ·页面的存储方式第38页
     ·基于“链接比”概念的更新策略第38-39页
   ·多线程技术的应用第39-41页
   ·使用网络代理第41-42页
第六章 实验结果与评价第42-45页
   ·性能评价指标第42页
   ·测试环境第42-43页
   ·测试结果与评价第43-45页
第七章 总结与展望第45-47页
参考文献第47-49页
致谢第49-50页
在学期间发表的学术论文和参加科研情况第50页

论文共50页,点击 下载论文
上一篇:PPP项目的风险分担及收益分配研究
下一篇:重庆东原房地产项目开发全成本管理及相关问题研究