摘要 | 第4-5页 |
Abstract | 第5页 |
专用术语注释 | 第8-9页 |
第一章 绪论 | 第9-12页 |
1.1 选题背景 | 第9页 |
1.2 国内外研究现状及意义 | 第9-10页 |
1.3 主要研究内容 | 第10-11页 |
1.4 章节安排 | 第11页 |
1.5 本章小结 | 第11-12页 |
第二章 相关技术介绍 | 第12-28页 |
2.1 数据仓库 | 第12-15页 |
2.1.1 数据仓库的特征 | 第12-14页 |
2.1.2 数据仓库与数据库之间的差异 | 第14-15页 |
2.1.3 数据仓库与数据库之间的联系 | 第15页 |
2.2 分布式数据库 | 第15-17页 |
2.2.1 分布式数据库的优点 | 第16-17页 |
2.2.2 分布式数据管理体系 | 第17页 |
2.3 ORACLE 数据库体系结构及相关技术 | 第17-26页 |
2.3.1 逻辑结构 | 第18-20页 |
2.3.2 物理结构 | 第20-21页 |
2.3.3 内存结构 | 第21-25页 |
2.3.4 ORACLE 中实现分布式数据库的关键组件 | 第25-26页 |
2.4 本章小结 | 第26-28页 |
第三章 系统概要设计 | 第28-37页 |
3.1 微博用户行为指纹分析系统设计背景 | 第28页 |
3.2 算法选择与介绍 | 第28-29页 |
3.3 系统概要设计 | 第29-36页 |
3.3.1 数据源处理 | 第30-31页 |
3.3.2 用户行为指纹分析 | 第31-35页 |
3.3.3 用户特殊文本信息指纹分析 | 第35-36页 |
3.3.4 平台间用户相似度匹配 | 第36页 |
3.4 本章小结 | 第36-37页 |
第四章 数据分片设计 | 第37-51页 |
4.1 分布式数据库系统分片的研究 | 第37-40页 |
4.1.1 分片设计的作用 | 第37-38页 |
4.1.2 分片设计的过程 | 第38页 |
4.1.3 分片设计的原则 | 第38-39页 |
4.1.4 分片的种类 | 第39-40页 |
4.1.5 数据分配 | 第40页 |
4.2 系统水平分片设计 | 第40-43页 |
4.2.1 水平分片设计 | 第41页 |
4.2.2 水平分片的正确性验证 | 第41-42页 |
4.2.3 分配方案设计 | 第42-43页 |
4.3 系统垂直分片设计 | 第43-49页 |
4.3.1 再次水平分片试验 | 第43-44页 |
4.3.2 垂直分片算法设计 | 第44-48页 |
4.3.3 垂直分片设计 | 第48页 |
4.3.4 垂直分片的正确性验证 | 第48-49页 |
4.3.5 分配方案设计 | 第49页 |
4.4 本章小结 | 第49-51页 |
第五章 分布式数据仓库系统的实现 | 第51-64页 |
5.1 ETL 系统 | 第51-54页 |
5.1.1 ETL 工具选择 | 第52页 |
5.1.2 数据抽取 | 第52-53页 |
5.1.3 数据转换 | 第53-54页 |
5.1.4 数据加载 | 第54页 |
5.2 分布式数据仓库系统设计 | 第54-61页 |
5.2.1 系统监控模块 | 第55-57页 |
5.2.2 全局数据字典 | 第57-58页 |
5.2.3 数据装载 | 第58-59页 |
5.2.4 查询透明化 | 第59-61页 |
5.3 系统应用展示 | 第61-63页 |
5.3.1 运行开发环境介绍 | 第61-62页 |
5.3.2 查询效果展示 | 第62-63页 |
5.4 本章小结 | 第63-64页 |
第六章 总结与展望 | 第64-66页 |
6.1 本文小节 | 第64页 |
6.2 工作展望 | 第64-66页 |
参考文献 | 第66-68页 |
附录1 攻读硕士学位期间撰写的论文 | 第68-69页 |
致谢 | 第69页 |