首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题爬虫搜索策略研究

摘要第1-9页
ABSTRACT第9-11页
第一章 绪论第11-15页
   ·研究背景第11-12页
   ·国内外相关研究现状第12-13页
   ·主要研究内容第13-14页
   ·本文的组织第14-15页
第二章 WEB搜索引擎概述第15-25页
   ·搜索引擎的分类第15-16页
   ·通用爬虫模型第16-18页
     ·通用爬虫的结构第16-18页
   ·主题爬虫模型第18-25页
     ·主题爬虫的原理第18-19页
     ·主题爬虫的结构第19-21页
     ·性能瓶颈分析第21-23页
     ·与普通爬虫的区别第23-25页
第三章 爬行策略概述第25-30页
   ·主题表示第25-26页
   ·网页分析算法第26-27页
   ·WEB文本相关性判定方法第27-30页
第四章 基于内容的爬行策略第30-46页
   ·WEB文档处理第30-31页
     ·中文的分词处理第31页
   ·关键词抽取第31-33页
   ·相关词抽取第33-34页
   ·特征选择及权值计算第34-36页
   ·基于内容评价的搜索模型第36-39页
     ·布尔模型第36-37页
     ·向量空间模型第37-39页
   ·基于内容评价启发搜索算法第39-46页
     ·Best First Search算法第39-41页
     ·Fish Search算法第41-42页
     ·Shark Search算法第42-46页
第五章 基于链接结构的搜索策略研究第46-53页
   ·PageRank算法第46-47页
   ·HITS算法第47-49页
   ·基于主题的HITS算法第49-53页
第六章 基于综合价值的主题爬行策略研究第53-62页
   ·基于综合价值搜索方案第53-55页
   ·基于综合价值的主题爬虫搜索策略实现第55-57页
   ·试验分析第57-62页
第七章 总结与展望第62-64页
   ·总结第62页
   ·展望第62-64页
参考文献第64-67页
致谢第67-68页
攻读学位期间发表的论文目录第68-69页
学位论文评阅及答辩情况表第69页

论文共69页,点击 下载论文
上一篇:基于视觉特征的三维网格数字水印算法
下一篇:高校网络数字化办公系统的设计与实现