数据清洗方法分析及其在网络日志数据处理中的应用
摘要 | 第4-5页 |
Abstract | 第5页 |
1 绪论 | 第8-13页 |
1.1 研究目的及意义 | 第8-9页 |
1.2 国内外研究现状 | 第9-11页 |
1.3 研究目标和所做的工作 | 第11-12页 |
1.4 论文的组织结构 | 第12-13页 |
2 错误检测算法及应用 | 第13-32页 |
2.1 脏数据的类型和来源 | 第13-15页 |
2.2 重复记录检测算法 | 第15-20页 |
2.3 属性级错误检测算法 | 第20-24页 |
2.4 日志数据空缺值检测算法的设计和实现 | 第24-30页 |
2.5 本章小结 | 第30-32页 |
3 数据修复算法及应用 | 第32-51页 |
3.1 重复记录修复算法 | 第32-35页 |
3.2 缺失值修复算法 | 第35-41页 |
3.3 一致性错误修复算法 | 第41-43页 |
3.4 日志数据空缺值修复算法选择与实现 | 第43-50页 |
3.5 本章小结 | 第50-51页 |
4 特征选择和构造算法及应用 | 第51-70页 |
4.1 基于数理统计的特征选择算法 | 第51-55页 |
4.2 基于进化算法的特征选择算法 | 第55-61页 |
4.3 特征构造算法 | 第61-63页 |
4.4 IPS日志特征选择 | 第63-69页 |
4.5 本章小结 | 第69-70页 |
5 总结与展望 | 第70-72页 |
5.1 全文总结 | 第70-71页 |
5.2 存在的问题 | 第71页 |
5.3 研究展望 | 第71-72页 |
致谢 | 第72-73页 |
参考文献 | 第73-82页 |