基于Schema特征的半结构化数据流频繁模式挖掘算法的研究

摘要	第4-5页
Abstract	第5页
第1章绪论	第8-14页
1.1 课题背景	第8-9页
1.2 相关研究	第9-11页
1.2.1 对半结构化数据的频繁模式挖掘研究	第9-10页
1.2.2 对数据流的频繁模式挖掘研究	第10-11页
1.2.3 对Schema特征的研究	第11页
1.3 本文的研究内容和主要贡献	第11-12页
1.4 课题来源	第12页
1.5 本文的组织结构	第12-14页
第2章背景知识与概念	第14-20页
2.1 频繁模式和最小支持度	第14页
2.2 非加权支持度和加权支持度	第14-15页
2.3 嵌入子树和诱导子树	第15-16页
2.4 Schema与Schema特征	第16-18页
2.5 本章小结	第18-20页
第3章基于滑动时间窗口的半结构化数据流处理模型	第20-28页
3.1 整体设计思路	第20-21页
3.2 patternTree结构	第21-23页
3.2.1 半结构化数据序列化	第22页
3.2.2 构造patternTree结构	第22-23页
3.3 序列化算法和patternTree的维护算法	第23-26页
3.4 本章小结	第26-28页
第4章对半结构化数据流分段的处理策略	第28-36页
4.1 整体设计思路	第28-29页
4.2 checkStack结构	第29-33页
4.2.1 补充完整被分割的半结构化数据	第29-30页
4.2.2 构造checkStack结构	第30-31页
4.2.3 创建开始指针和检测指针	第31-33页
4.3 Check算法	第33-34页
4.4 本章小结	第34-36页
第5章基于Schema特征的SPrefixTreeISpan挖掘算法	第36-44页
5.1 整体设计思路	第36-38页
5.2 Schema特征提取策略	第38页
5.3 Schema特征提取算法	第38-40页
5.4 对XML数据段的挖掘方案	第40-41页
5.5 SPrefixTreeISpan算法	第41-42页
5.6 本章小结	第42-44页
第6章实验	第44-48页
6.1 实验方案	第44-45页
6.2 实验结果	第45-46页
6.3 本章小结	第46-48页
结论	第48-50页
参考文献	第50-54页
攻读硕士学位期间所获得的研究成果	第54-56页
致谢	第56页