基于互联网数据的中国流感趋势预测研究
摘要 | 第5-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第12-20页 |
1.1 研究背景 | 第12-13页 |
1.2 研究现状 | 第13-18页 |
1.2.1 利用搜索引擎进行流感趋势监测 | 第13-15页 |
1.2.2 利用社交网络进行流感趋势监测 | 第15-16页 |
1.2.3 利用在线地图工具进行流感趋势监测 | 第16-18页 |
1.3 研究内容与主要工作 | 第18-19页 |
1.4 论文的组织结构 | 第19-20页 |
第2章 相关技术概述 | 第20-28页 |
2.1 相关性分析 | 第20-23页 |
2.1.1 皮尔森(Pearson)相关系数 | 第20-21页 |
2.1.2 斯皮尔曼(Spearman)相关系数 | 第21-22页 |
2.1.3 肯德尔(Kendall)相关系数 | 第22-23页 |
2.2 回归分析 | 第23-25页 |
2.2.1 一元线性回归分析 | 第24页 |
2.2.2 多元线性回归分析 | 第24-25页 |
2.3 交叉验证 | 第25-26页 |
2.3.1 重复随机抽样验证 | 第25-26页 |
2.3.2 K倍交叉验证 | 第26页 |
2.3.3 留一法交叉验证 | 第26页 |
2.4 反向测试 | 第26-27页 |
2.5 R概述 | 第27页 |
2.6 小结 | 第27-28页 |
第3章 基于新浪微博的流感趋势预测 | 第28-40页 |
3.1 微博数据的获取方式 | 第28-32页 |
3.1.1 利用微博开放平台获取 | 第28-31页 |
3.1.2 利用网络爬虫获取 | 第31-32页 |
3.2 数据来源 | 第32-35页 |
3.2.1 流感样病例 | 第32-33页 |
3.2.2 主题关键词 | 第33-34页 |
3.2.3 微博主题数据 | 第34-35页 |
3.3 实验结果与分析 | 第35-38页 |
3.3.1 相关性分析 | 第35页 |
3.3.2 模型估计与预测 | 第35-38页 |
3.4 小结 | 第38-40页 |
第4章 基于不同指数的流感趋势预测 | 第40-54页 |
4.1 数据来源 | 第40-43页 |
4.1.1 流感样病例 | 第40-41页 |
4.1.2 主题关键词 | 第41页 |
4.1.3 百度指数 | 第41页 |
4.1.4 好搜指数 | 第41-42页 |
4.1.5 微指数 | 第42-43页 |
4.2 流行周期和峰值时间 | 第43页 |
4.2.1 流行周期 | 第43页 |
4.2.2 峰值时间 | 第43页 |
4.3 实验结果与分析 | 第43-52页 |
4.3.1 时间序列数据比较 | 第43-47页 |
4.3.2 相关性分析 | 第47-48页 |
4.3.3 流行周期和峰值时间 | 第48-49页 |
4.3.4 模型估计与预测 | 第49-52页 |
4.4 小结 | 第52-54页 |
结论 | 第54-56页 |
参考文献 | 第56-60页 |
致谢 | 第60-61页 |
附录 A 攻读硕士学位期间所发表的学术论文目录 | 第61-62页 |
附录 B 攻读硕士学位期间所参与的学术科研活动 | 第62页 |