基于DNS查询日志的互联网访问模式分析
摘要 | 第1-3页 |
Abstract | 第3-8页 |
第1章 引言 | 第8-13页 |
·选题背景和意义 | 第8-11页 |
·研究内容与思路 | 第11-12页 |
·论文主要工作和结构安排 | 第12-13页 |
第2章 DNS 数据特点及现有分析方法 | 第13-20页 |
·DNS 的体系结构和基本原理 | 第13-15页 |
·DNS 的体系结构 | 第13-14页 |
·DNS 的基本原理 | 第14页 |
·DNS 记录提供的信息 | 第14-15页 |
·主要的DNS 数据分析方法 | 第15-20页 |
·DNS 测量 | 第15-16页 |
·现有 DNS 数据分析 | 第16-20页 |
第3章 数据分析理论基础 | 第20-37页 |
·有监督与无监督分类 | 第20页 |
·模式相似性的度量 | 第20-22页 |
·基本聚类算法 | 第22-26页 |
·层次聚类 | 第22-23页 |
·基于划分的算法 | 第23-26页 |
·大规模数据库聚类 | 第26-33页 |
·BIRCH 算法 | 第27-31页 |
·CURE 算法 | 第31-32页 |
·CHAMELEON 算法 | 第32-33页 |
·聚类算法的选择 | 第33-34页 |
·相关统计分布规律 | 第34-37页 |
·幂律(Power-law)分布 | 第34-35页 |
·Zipf 分布 | 第35页 |
·广延指数分布 | 第35-36页 |
·Heaps 分布 | 第36-37页 |
第4章 CN 节点的DNS 数据特征 | 第37-41页 |
·测量方法和数据 | 第38页 |
·原始数据的预处理 | 第38-41页 |
·无效的查询记录、IP 地址和域名 | 第38页 |
·无关字段 | 第38-39页 |
·域名规约 | 第39-41页 |
第5章 CN 节点的DNS 查询日志分析 | 第41-63页 |
·统计特性描述 | 第41-49页 |
·流量分布 | 第41-42页 |
·用户请求频率分布 | 第42-43页 |
·域名被查询频率分布 | 第43-44页 |
·查询记录类型分布 | 第44页 |
·源地址端口号分布 | 第44-45页 |
·域名的查询频率特征分析 | 第45-47页 |
·用户的请求频率分布特征分析 | 第47-48页 |
·小结 | 第48-49页 |
·聚类分析 | 第49-63页 |
·特征提取 | 第49-50页 |
·算法选择 | 第50-51页 |
·用户访问模式分析 | 第51-53页 |
·域名被查询模式分析 | 第53-56页 |
·小结 | 第56-57页 |
·层次聚类分析 | 第57-61页 |
·层次聚类和K-means 算法的对比 | 第61-63页 |
第6章 结论与展望 | 第63-65页 |
·总结 | 第63-64页 |
·展望 | 第64-65页 |
参考文献 | 第65-68页 |
致谢 | 第68-69页 |
个人简历、在学期间发表的学术论文与研究成果 | 第69页 |