基于用户行为及关系的微博电商企业影响力度量
摘要 | 第1-6页 |
Abstract | 第6-10页 |
1 绪论 | 第10-20页 |
·研究的背景与意义 | 第10-11页 |
·国内外文献综述 | 第11-18页 |
·待深入研究的问题 | 第18-19页 |
·新浪API的访问接口限制 | 第18页 |
·传统的网络爬虫获取数据效率低 | 第18-19页 |
·主要研究内容 | 第19-20页 |
2 API和网络爬虫结合获取数据 | 第20-38页 |
·基于网络爬虫获取数据 | 第20-27页 |
·网络爬虫简介 | 第20-24页 |
·HTTPClient代理客户端 | 第24-27页 |
·基于新浪API获取数据 | 第27-32页 |
·基于网络爬虫与API结合获取数据 | 第32-37页 |
·API获取用户属性接口 | 第34-36页 |
·网络爬虫模拟用户登录新浪微博 | 第36-37页 |
·本章小结 | 第37-38页 |
3 电商用户社交关系的聚类 | 第38-47页 |
·网络水军简介 | 第38-39页 |
·僵尸账户简介 | 第39-41页 |
·利用K-means算法聚类电商用户关系 | 第41-42页 |
·聚类算法描述 | 第42-46页 |
·本章小结 | 第46-47页 |
4 基于MongoDB电商用户数据库设计 | 第47-53页 |
·MongoDB数据简介 | 第47页 |
·MongoDB特点及功能 | 第47-48页 |
·传统的关系型数据库不能满足存储半结构化数据 | 第48-49页 |
·MongoDB的运行与数据库连接 | 第49页 |
·MongoDB对关系、行为数据的存储与查询 | 第49-51页 |
·遇到的问题及解决方法 | 第51页 |
·实验环境 | 第51-52页 |
·本章小结 | 第52-53页 |
5 电商用户影响力计算和数据可视化 | 第53-60页 |
·微博影响力 | 第53页 |
·电商用户影响力计算 | 第53-57页 |
·影响力线性计算方法 | 第53-56页 |
·利用统计学方法进行相关分析 | 第56-57页 |
·Gephi数据可视化 | 第57-59页 |
·本章小结 | 第59-60页 |
结论 | 第60-61页 |
参考文献 | 第61-64页 |
附录A | 第64-66页 |
附录B | 第66-69页 |
致谢 | 第69页 |