首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Web对象的分布式抓取及存储的设计与研究

摘要第1-4页
Abstract第4-9页
第一章 绪言第9-14页
   ·课题研究背景第9-10页
   ·课题研究的国内外现状第10页
   ·本课题主要研究内容和意义第10-11页
   ·本课题要实现的目标第11-12页
   ·论文的组织结构第12-13页
   ·本章小结第13-14页
第二章 课题相关技术研究第14-27页
   ·网络爬虫技术研究第14-15页
   ·网页的净化和消重技术研究第15-17页
     ·网页净化技术研究第15-16页
     ·网页消重技术研究第16-17页
   ·分布式存储技术研究第17-21页
     ·分布式数据库技术研究第17-20页
     ·分布式文件系统研究第20-21页
   ·Perl脚本语言介绍第21-23页
     ·网页分析选择Perl的理由第21-22页
     ·C和 C++程序中嵌入Perl脚本介绍第22-23页
   ·SUNRPC介绍第23-25页
   ·Trie树介绍第25-26页
   ·本章小结第26-27页
第三章 网页消重技术的研究第27-38页
   ·网页消重问题的提出第27页
   ·网页消重问题的分析研究第27-31页
     ·基于网页URL的消重技术研究第27-30页
     ·基于网页内容的消重技术研究第30-31页
   ·解决网页消重问题的算法研究第31-36页
     ·基于新闻网页URL消重算法第31-35页
     ·针对新闻内容的消重算法研究第35-36页
   ·针对新闻网页消重算法的性能测试第36-37页
   ·本章小结第37-38页
第四章 Web对象的分布式抓取设计第38-54页
   ·Web对象分布式抓取的研究背景第38页
   ·分布式URL分配算法研究第38-41页
     ·常见Hash函数介绍第39-40页
     ·构造URL分配Hash算法第40-41页
   ·分布式网络爬虫的总体设计方案第41-44页
     ·一般爬虫设计方案介绍第41-42页
     ·分布式爬虫系统设计方案第42-44页
     ·分布式爬虫系统设计方案的具体实施第44页
   ·分布式网络爬虫系统的总体架构第44-46页
   ·分布式网络爬虫具体实现第46-52页
   ·本章小结第52-54页
第五章 Web对象的分布式存储设计第54-74页
   ·存储需求与背景第54-57页
   ·存储系统的设计目标第57-59页
   ·针对存储目标的设计方案第59-61页
   ·存储系统架构设计第61-63页
   ·存储系统的整体实现第63-73页
     ·存储控制服务器功能实现第63-69页
     ·存储服务器端功能实现第69-73页
   ·本章小结第73-74页
第六章 总结与展望第74-77页
   ·本论文研究成果第74-75页
   ·进一步的工作第75-77页
致谢第77-78页
参考文献第78-83页
附录 A:攻读学位期间发表论文情况第83页

论文共83页,点击 下载论文
上一篇:基于UCON的Web Services访问控制的研究
下一篇:军网中基于IPSec的综合加密身份识别技术实现