摘要 | 第4-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第14-24页 |
1.1 课题研究背景 | 第14-20页 |
1.1.1 OpenClassrooms网站简介 | 第15-16页 |
1.1.2 OpenClassrooms课程结构 | 第16页 |
1.1.3 用户行为研究 | 第16-18页 |
1.1.4 会员用户背景与研究 | 第18-19页 |
1.1.5 频繁模式挖掘挖掘及其应用价值 | 第19-20页 |
1.2 国内外研究现状 | 第20-22页 |
1.3 论文主要内容与结构安排 | 第22-24页 |
第二章 事务数据库设计 | 第24-35页 |
2.1 事务数据库搭建 | 第24页 |
2.2 SQLite数据库管理系统 | 第24-25页 |
2.3 数据表设计 | 第25-35页 |
2.3.1 Course表结构与分析 | 第25-27页 |
2.3.2 User表结构与分析 | 第27-28页 |
2.3.3 Premium表结构与分析 | 第28-29页 |
2.3.4 Session表结构与分析 | 第29-31页 |
2.3.5 Quizz表结构与分析 | 第31-33页 |
2.3.6 Subscription表结构与分析 | 第33-35页 |
第三章 数据预处理与分析 | 第35-49页 |
3.1 数据选取 | 第35页 |
3.2 用户阅读行为特征选取 | 第35-37页 |
3.3 数据清洗 | 第37-39页 |
3.4 数据集成 | 第39-40页 |
3.5 数据归约 | 第40-43页 |
3.5.1 数据立方体聚集 | 第40-41页 |
3.5.2 属性子集选择 | 第41-43页 |
3.6 数据分析与预处理结果 | 第43-49页 |
3.6.1 数据表基本信息 | 第43-46页 |
3.6.2 阅读会话的数据预处理分析 | 第46-49页 |
第四章 基于阅读会话的频繁模式挖掘 | 第49-69页 |
4.1 关联规则 | 第49-51页 |
4.1.1 关联规则的基本概念 | 第50-51页 |
4.1.2 关联规则的基本性质 | 第51页 |
4.2 Apriori算法 | 第51-56页 |
4.2.1 Apriori算法的基本约定 | 第52页 |
4.2.2 Apriori算法的基本步骤 | 第52-53页 |
4.2.3 Apriori算法描述 | 第53页 |
4.2.4 Apriori算法实现示例 | 第53-56页 |
4.3 FP-Growth算法 | 第56-61页 |
4.3.1 FP-Growth的基本步骤 | 第57页 |
4.3.2 FP-tree的基本结构 | 第57-59页 |
4.3.3 FP-Growth算法的基本概念 | 第59-60页 |
4.3.4 FP-Growth算法描述 | 第60-61页 |
4.4 FPMax算法 | 第61-64页 |
4.4.1 MFI-tree的基本结构 | 第61-63页 |
4.4.2 FPMax算法描述 | 第63-64页 |
4.5 基于Reading Session的RS-FPMax算法 | 第64-66页 |
4.6 频繁模式挖掘的结果及应用 | 第66-69页 |
第五章 频繁模式挖掘的序列比对 | 第69-83页 |
5.1 序列距离 | 第69页 |
5.2 序列比对 | 第69-70页 |
5.3 序列比对得分系统介绍与方案选择 | 第70-71页 |
5.4 双序列全局比对Needleman-Wunsch算法 | 第71-74页 |
5.5 双序列局部比对Smith-Waterman算法 | 第74-77页 |
5.6 实验与应用 | 第77-83页 |
总结 | 第83-85页 |
参考文献 | 第85-89页 |
攻读学位期间发表论文 | 第89-91页 |
致谢 | 第91页 |