分布式环境下的张量分解算法研究

摘要	第3-5页
Abstract	第5-6页
第一章引言	第12-17页
1.1 课题研究背景	第12-13页
1.2 课题研究现状	第13-14页
1.3 本文的主要工作及创新点	第14-15页
1.4 论文组织结构	第15-17页
第二章张量相关知识	第17-28页
2.1 张量	第17-19页
2.2 基本运算	第19-21页
2.2.1 矩阵化	第19-21页
2.2.2 伪逆	第21页
2.3 CP分解	第21-24页
2.3.1 张量的秩	第22-23页
2.3.2 CP分解的ALS算法	第23-24页
2.4 Tucker分解	第24-26页
2.4.1 张量的n-rank	第25页
2.4.2 Tucker分解的ALS算法	第25-26页
2.5 张量分解的应用	第26-28页
第三章大数据平台相关知识	第28-33页
3.1 Hadoop	第28-30页
3.1.1 HDFS	第29-30页
3.1.2 Hadoop MapReduce	第30页
3.2 Spark	第30-33页
3.2.1 RDD	第31-32页
3.2.2 共享变量	第32-33页
第四章基于Spark平台的ParaTD总体设计	第33-37页
4.1 设计目标	第33页
4.2 总体框架	第33-34页
4.3 总体流程	第34-37页
第五章 ParaTD算法设计与实现	第37-53页
5.1 数据结构设计	第39-40页
5.1.1 离线存储张量数据文件的设计	第39页
5.1.2 张量数据结构的设计	第39-40页
5.2 拆分Khatri-Rao乘积	第40-44页
5.2.1 算法分析与描述	第40-43页
5.2.2 MapReduce设计	第43-44页
5.3 并行计算外积	第44-49页
5.3.1 算法分析与描述	第44-47页
5.3.2 MapReduce设计	第47-49页
5.4 分布式缓存乘积	第49-53页
5.4.1 算法分析与描述	第49-53页
第六章 ParaTD性能测试与分析	第53-61页
6.1 ParaTD测试环境及测评方案	第53-56页
6.1.1 测试环境	第53-55页
6.1.2 测评方案	第55-56页
6.2 测试结果分析	第56-61页
6.2.1 CP分解的正确性测试	第56页
6.2.2 张量大小不同的情况	第56-58页
6.2.3 集群大小不同的情况	第58-59页
6.2.4 张量密度不同的情况	第59-61页
第七章总结与展望	第61-63页
7.1 工作总结	第61页
7.2 工作展望	第61-63页
参考文献	第63-66页
攻读硕士学位期间完成的科研成果	第66-67页
致谢	第67页