首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于hadoop的网络爬虫技术研究

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-13页
   ·本研究课题的目的和意义第9-11页
   ·本研究课题目前的现状第11-12页
   ·本文内部结构第12-13页
第2章 分布式技术第13-20页
   ·相关云计算的知识第13-17页
     ·云计算原理与结构第13-15页
     ·典型云计算的平台第15-17页
   ·hadoop平台相关知识第17-19页
     ·基于hadoop的分布式文件系统第17-18页
     ·Map/Reduce计算模型第18-19页
   ·本章小结第19-20页
第3章 网络爬虫技术知识第20-36页
   ·网络爬虫知识第20-26页
     ·网络爬虫基本原理简述第20页
     ·网络爬虫体系结构解析第20-23页
     ·网络爬虫常用爬行决策第23-26页
   ·分布式网络爬虫相关知识第26-29页
     ·分布式网络爬虫原理第26-29页
   ·负载均衡第29-35页
   ·本章小结第35-36页
第4章 页面分析技术第36-51页
   ·链接分析原理概述第36页
   ·链接分析模型第36-38页
   ·链接分析算法第38-44页
     ·反向链接分析算法第38-39页
     ·PageRank算法第39页
     ·HITS算法第39-41页
     ·典型优化HITS算法第41-44页
   ·改进算法的提出——M-HITS第44-50页
     ·向量空间模型基本概念第44-47页
     ·查询和文档向量的匹配第47页
     ·改进方案第47-48页
     ·邻接图节点矢量表示第48页
     ·查询主题矢量表示第48-49页
     ·相似度的计算第49页
     ·M-HITS算法步骤第49-50页
   ·本章小结第50-51页
第5章 验证与分析第51-55页
   ·系统结构第51-52页
   ·实验环境第52页
   ·结果分析第52-54页
   ·本章小结第54-55页
第6章 总结和展望第55-57页
致谢第57-58页
参考文献第58-61页
攻读硕士期间参与的项目第61页

论文共61页,点击 下载论文
上一篇:Android多媒体系统实现过程中的关键技术研究
下一篇:面向智能楼宇监控的组态软件设计与开发