首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

主题爬虫URL分析模型与调度技术研究

摘要第1-6页
Abstract第6-9页
第1章 绪论第9-15页
   ·课题研究背景第9-12页
   ·课题研究意义第12-13页
   ·论文研究内容第13-14页
   ·论文组织结构第14-15页
第2章 主题爬虫URL分析模型及调度技术研究现状第15-30页
   ·引言第15页
   ·URL分析模型研究现状第15-25页
     ·基于内容评价的模型第15-20页
     ·基于链接评价的模型第20-23页
     ·基于分类器预测的模型第23-25页
     ·其它分析模型第25页
   ·URL调度技术研究现状第25-29页
     ·Larbin爬虫第26-27页
     ·北大天网爬虫第27页
     ·基于双哈希算法的调度第27-28页
     ·基于GNP算法的调度第28-29页
   ·本章小结第29-30页
第3章 内容评价与链接评价相结合的URL分析模型第30-46页
   ·引言第30页
   ·文档预处理过程第30-35页
     ·中文分词第31-33页
     ·特征提取第33-34页
     ·权重计算第34-35页
   ·内容评价与链接评价相结合的URL分析模型第35-40页
     ·QM模型第35-36页
     ·内容评价与链接评价相结合的URL分析模型第36-40页
   ·实验结果与分析第40-45页
     ·实验步骤第40-41页
     ·实验结果第41-43页
     ·实验分析第43-45页
   ·本章小结第45-46页
第4章 面向多节点并行爬取的URL调度方案第46-58页
   ·引言第46页
   ·节点间URL调度方案第46-54页
     ·URL去重第46-48页
     ·URL主题相关性计算第48页
     ·URL分配第48-53页
     ·URL传输第53-54页
   ·节点内URL调度方案第54-55页
     ·DNS查询第54页
     ·队列设置第54-55页
   ·实验结果与分析第55-57页
     ·实验步骤第55页
     ·实验结果第55-56页
     ·实验分析第56-57页
   ·本章小结第57-58页
结论第58-59页
参考文献第59-63页
攻读硕士学位期间发表的论文和取得的科研成果第63-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:基于P2P技术的广电新媒体网站设计与实现
下一篇:面向网络安全态势评估系统的态势评估算法设计