基于标签的模糊匹配微博人脉挖掘算法
| 摘要 | 第3-5页 |
| Abstract | 第5-6页 |
| 第一章 绪论 | 第9-15页 |
| 1.1 研究背景 | 第9页 |
| 1.2 研究目的和意义 | 第9-11页 |
| 1.3 微博及其发展现状 | 第11-13页 |
| 1.3.1 微博发展现状 | 第11-12页 |
| 1.3.2 新浪微博的功能和特点 | 第12-13页 |
| 1.4 本文的研究内容 | 第13页 |
| 1.5 论文的主要创新点 | 第13-15页 |
| 第二章 微博数据获取技术 | 第15-28页 |
| 2.1 数据挖掘综述 | 第15-18页 |
| 2.2 网络爬虫技术 | 第18-24页 |
| 2.2.1 通用网络爬虫 | 第19-22页 |
| 2.2.2 聚焦网络爬虫 | 第22-24页 |
| 2.3 基于API的数据获取技术 | 第24-27页 |
| 2.4 本章小结 | 第27-28页 |
| 第三章 基于标签的模糊匹配算法 | 第28-48页 |
| 3.1 标签和标签系统 | 第28-31页 |
| 3.1.1 标签 | 第28-29页 |
| 3.1.2 标签系统 | 第29-31页 |
| 3.2 标准库的建立 | 第31-34页 |
| 3.3 模糊匹配 | 第34-41页 |
| 3.3.1 模糊匹配的思想 | 第34页 |
| 3.3.2 模糊匹配方法 | 第34-41页 |
| 3.4 基于标签的模糊匹配人脉挖掘算法 | 第41-44页 |
| 3.5 实验结果 | 第44-47页 |
| 3.6 本章小结 | 第47-48页 |
| 第四章 微博网络结构特性 | 第48-55页 |
| 4.1 复杂网络基本参数 | 第48-51页 |
| 4.1.1 节点度和度分布 | 第48页 |
| 4.1.2 平均路径长度和直径 | 第48-49页 |
| 4.1.3 聚类系数 | 第49页 |
| 4.1.4 复杂网络基本拓扑模型 | 第49-51页 |
| 4.2 微博网络特性 | 第51-54页 |
| 4.2.1 微博数据采集 | 第51-52页 |
| 4.2.2 微博网络属性 | 第52-54页 |
| 4.3 本章小结 | 第54-55页 |
| 第五章 总结与展望 | 第55-56页 |
| 参考文献 | 第56-62页 |
| 攻读硕士学位期间参与的科研项目 | 第62-63页 |
| 致谢 | 第63-64页 |