摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第10-15页 |
1.1 课题背景 | 第10-12页 |
1.2 国内外研究现状 | 第12-13页 |
1.3 研究内容和章节安排 | 第13-15页 |
第二章 数据内容还原分析相关技术介绍 | 第15-27页 |
2.1 数据采集相关技术介绍 | 第15-19页 |
2.1.1 基于LIBPCAP的数据采集 | 第15-16页 |
2.1.2 零拷贝技术 | 第16-19页 |
2.2 应用层内容还原相关技术 | 第19-21页 |
2.2.1 TCP流还原 | 第19-21页 |
2.2.2 基于TCP流还原的应用层内容还原的缺点 | 第21页 |
2.3 数据分析相关技术 | 第21-26页 |
2.3.1 HTML与MIME | 第21-23页 |
2.3.2 ICTCLAS | 第23-26页 |
2.4 本章小结 | 第26-27页 |
第三章 基于NETMAP-LIBPCAP的数据采集方法 | 第27-39页 |
3.1 LIBPCAP的速度瓶颈分析 | 第27-28页 |
3.2 高速I/O架构NETMAP | 第28-32页 |
3.2.1 NETMAP的架构分析 | 第28-30页 |
3.2.2 NETMAP的编程模型 | 第30-32页 |
3.3 NETMAP-LIBPCAP数据采集方法 | 第32-34页 |
3.3.1 NETMAP-LIBPCAP的设计 | 第32-33页 |
3.3.2 NETMAP-LIBPCAP的实现 | 第33-34页 |
3.4 实验验证与结果分析 | 第34-38页 |
3.4.1 实验方案 | 第34-35页 |
3.4.2 实验结果与分析 | 第35-38页 |
3.5 本章小结 | 第38-39页 |
第四章 应用层内容的直接还原技术研究 | 第39-60页 |
4.1 应用层内容的直接还原 | 第39-45页 |
4.1.1 直接内容还原的原理及可行性分析 | 第39-41页 |
4.1.2 直接内容还原的优点分析 | 第41-42页 |
4.1.3 直接内容还原的设计 | 第42-45页 |
4.2 网页元素的直接内容还原 | 第45-53页 |
4.2.1 网页元素内容还原的原理 | 第45-47页 |
4.2.2 网页元素的简单内容还原 | 第47-49页 |
4.2.3 网页元素的断续内容还原 | 第49-51页 |
4.2.4 网页元素的复杂内容还原 | 第51-53页 |
4.3 邮件的直接内容还原 | 第53-57页 |
4.3.1 邮件内容还原的原理 | 第53-55页 |
4.3.2 邮件的断续内容还原 | 第55-57页 |
4.3.3 邮件的复杂内容还原 | 第57页 |
4.4 直接内容还原的实验验证 | 第57-59页 |
4.4.1 网页元素的内容还原验证 | 第57-58页 |
4.4.2 邮件的内容还原验证 | 第58-59页 |
4.5 本章小结 | 第59-60页 |
第五章 数据内容还原分析系统设计与实现 | 第60-69页 |
5.1 系统总体设计 | 第60-61页 |
5.2 数据采集与内容还原子系统设计 | 第61-62页 |
5.3 文本提取子系统设计 | 第62-66页 |
5.3.1 网页文本提取 | 第63-64页 |
5.3.2 邮件文本提取 | 第64-66页 |
5.4 文本分析子系统设计 | 第66-68页 |
5.5 本章小结 | 第68-69页 |
第六章 总结 | 第69-71页 |
6.1 论文贡献和创新点 | 第69页 |
6.2 下一步工作 | 第69-71页 |
参考文献 | 第71-74页 |
致谢 | 第74-75页 |
攻读硕士期间发表的学术论文 | 第75页 |