基于DNS查询日志的互联网访问模式分析
| 摘要 | 第1-3页 |
| Abstract | 第3-8页 |
| 第1章 引言 | 第8-13页 |
| ·选题背景和意义 | 第8-11页 |
| ·研究内容与思路 | 第11-12页 |
| ·论文主要工作和结构安排 | 第12-13页 |
| 第2章 DNS 数据特点及现有分析方法 | 第13-20页 |
| ·DNS 的体系结构和基本原理 | 第13-15页 |
| ·DNS 的体系结构 | 第13-14页 |
| ·DNS 的基本原理 | 第14页 |
| ·DNS 记录提供的信息 | 第14-15页 |
| ·主要的DNS 数据分析方法 | 第15-20页 |
| ·DNS 测量 | 第15-16页 |
| ·现有 DNS 数据分析 | 第16-20页 |
| 第3章 数据分析理论基础 | 第20-37页 |
| ·有监督与无监督分类 | 第20页 |
| ·模式相似性的度量 | 第20-22页 |
| ·基本聚类算法 | 第22-26页 |
| ·层次聚类 | 第22-23页 |
| ·基于划分的算法 | 第23-26页 |
| ·大规模数据库聚类 | 第26-33页 |
| ·BIRCH 算法 | 第27-31页 |
| ·CURE 算法 | 第31-32页 |
| ·CHAMELEON 算法 | 第32-33页 |
| ·聚类算法的选择 | 第33-34页 |
| ·相关统计分布规律 | 第34-37页 |
| ·幂律(Power-law)分布 | 第34-35页 |
| ·Zipf 分布 | 第35页 |
| ·广延指数分布 | 第35-36页 |
| ·Heaps 分布 | 第36-37页 |
| 第4章 CN 节点的DNS 数据特征 | 第37-41页 |
| ·测量方法和数据 | 第38页 |
| ·原始数据的预处理 | 第38-41页 |
| ·无效的查询记录、IP 地址和域名 | 第38页 |
| ·无关字段 | 第38-39页 |
| ·域名规约 | 第39-41页 |
| 第5章 CN 节点的DNS 查询日志分析 | 第41-63页 |
| ·统计特性描述 | 第41-49页 |
| ·流量分布 | 第41-42页 |
| ·用户请求频率分布 | 第42-43页 |
| ·域名被查询频率分布 | 第43-44页 |
| ·查询记录类型分布 | 第44页 |
| ·源地址端口号分布 | 第44-45页 |
| ·域名的查询频率特征分析 | 第45-47页 |
| ·用户的请求频率分布特征分析 | 第47-48页 |
| ·小结 | 第48-49页 |
| ·聚类分析 | 第49-63页 |
| ·特征提取 | 第49-50页 |
| ·算法选择 | 第50-51页 |
| ·用户访问模式分析 | 第51-53页 |
| ·域名被查询模式分析 | 第53-56页 |
| ·小结 | 第56-57页 |
| ·层次聚类分析 | 第57-61页 |
| ·层次聚类和K-means 算法的对比 | 第61-63页 |
| 第6章 结论与展望 | 第63-65页 |
| ·总结 | 第63-64页 |
| ·展望 | 第64-65页 |
| 参考文献 | 第65-68页 |
| 致谢 | 第68-69页 |
| 个人简历、在学期间发表的学术论文与研究成果 | 第69页 |