面向多站点Web日志挖掘中的数据采集与预处理技术研究

摘要	第1-4页
ABSTRACT	第4-8页
1 绪论	第8-12页
·研究背景和意义	第8-9页
·研究现状	第9-10页
·研究内容及组织结构	第10-12页
2 Web 数据挖掘及相关技术	第12-32页
·数据挖掘	第12-13页
·数据挖掘的定义	第12页
·数据挖掘的过程	第12-13页
·Web 挖掘	第13-17页
·Web 挖掘定义	第13页
·Web 挖掘分类	第13-15页
·Web 挖据的特点	第15-16页
·Web 挖据的主要应用	第16-17页
·Web 日志挖掘	第17-20页
·Web 日志挖掘概论	第17-19页
·Web 日志挖掘流程	第19-20页
·数据包捕获	第20-25页
·数据包捕获原理	第20-22页
·数据包过滤	第22-24页
·Libpcap 函数库	第24-25页
·HTTP 协议分析	第25-28页
·HTTP 概述	第25页
·HTTP 协议格式	第25-28页
·Wireshark 工具简介	第28-31页
·捕获过滤器	第28-29页
·显示过滤器	第29-31页
·本章小结	第31-32页
3 Web 日志数据采集与预处理	第32-44页
·面向多站点采集与预处理存在的问题	第32-33页
·Web 日志数据采集	第33-37页
·传统采集方法	第33-35页
·网络嗅探采集方法	第35-37页
·数据清理	第37-43页
·页面请求分类	第37-39页
·传统清理方法	第39页
·数据转换与合并	第39-40页
·基于引用和时间关系的清理方法	第40-43页
·本章小结	第43-44页
4 实验结果及分析	第44-49页
·实验评价标准	第44页
·实验过程	第44-47页
·数据采集	第44-45页
·传统清理	第45页
·基于引用和时间关系的清理	第45-47页
·实验分析	第47-49页
5 总结与展望	第49-51页
·本文总结	第49-50页
·进一步的工作	第50-51页
致谢	第51-52页
参考文献	第52-54页
附录	第54页
A. 作者在攻读硕士学位期间发表的论文目录	第54页
B. 作者在攻读硕士学位期间参与的科研项目	第54页