首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

社会化网络数据获取技术研究与实现

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-13页
   ·研究背景及意义第10-11页
   ·研究现状第11-12页
   ·本文组织结构第12-13页
第2章 本文涉及的相关知识第13-25页
   ·爬虫基本概念第13-14页
   ·URL去重第14-15页
     ·磁盘顺序存储第14-15页
     ·MD5第15页
     ·布隆过滤器第15页
   ·Ajax第15-16页
   ·相关工具介绍第16-19页
     ·Python第16页
     ·Beautiful Soup第16页
     ·Requests第16-18页
     ·pyExcelerator第18页
     ·MySQL第18页
     ·UCINET第18-19页
   ·图论及社会化网络相关知识第19-25页
     ·结点第19页
     ·边第19-20页
     ·度第20页
     ·图的表示第20-21页
     ·中心性第21-23页
     ·社区发现第23-25页
第3章 爬虫基本设计第25-42页
   ·知乎网结构分析第25-28页
   ·爬虫需要解决的问题第28-30页
     ·数据的获取第28-29页
     ·网站的反爬虫机制第29-30页
     ·爬虫的效率第30页
   ·数据库设计第30-33页
   ·爬虫主要模块设计第33-42页
     ·模拟登录模块第33-34页
     ·用户解析模块第34-36页
     ·问题解析模块第36-38页
     ·话题解析模块第38-39页
     ·数据存储模块第39-40页
     ·控制模块第40-41页
     ·用户网络邻接矩阵生成模块第41-42页
第4章 知乎全网爬虫第42-53页
   ·知乎全网用户爬虫第43-48页
     ·知乎全网用户爬虫策略第43-47页
     ·知乎全网用户爬虫的实现第47-48页
   ·知乎全网问题爬虫第48-50页
     ·知乎全网问题爬虫策略第48-49页
     ·知乎全网问题爬虫的实现第49-50页
   ·实验与结果分析第50-53页
第5章 知乎主题爬虫第53-62页
   ·知乎主题爬虫策略第54-56页
   ·知乎主题爬虫的实现第56-58页
   ·实验与知乎社区分析第58-62页
     ·数据的选取第58-59页
     ·中心性分析第59-61页
     ·派系分析第61-62页
第6章 总结与展望第62-63页
参考文献第63-66页
附录:用户关注关系列表第66-78页
致谢第78页

论文共78页,点击 下载论文
上一篇:一种基于近邻传播的边聚类方法研究
下一篇:铁路客运在逃人员综合筛查系统的设计与实现