中文摘要 | 第3-4页 |
英文摘要 | 第4-5页 |
1 绪论 | 第8-14页 |
1.1 研究背景与意义 | 第8-9页 |
1.2 国内外研究现状 | 第9-11页 |
1.3 论文研究内容 | 第11-12页 |
1.4 论文组织结构 | 第12-14页 |
2 背景知识 | 第14-23页 |
2.1 差分隐私 | 第14-18页 |
2.1.1 差分隐私定义 | 第14-15页 |
2.1.2 差分隐私的组合特性 | 第15-16页 |
2.1.3 安全模型 | 第16页 |
2.1.4 差分隐私保护模式 | 第16页 |
2.1.5 差分隐私与K-匿名和L-多样化的比较 | 第16-18页 |
2.2 分类与回归树 | 第18-19页 |
2.3 集成学习技术 | 第19-22页 |
2.3.1 提升法和装袋法 | 第19-20页 |
2.3.2 随机森林算法 | 第20-21页 |
2.3.3 自适应提升算法 | 第21-22页 |
2.4 本章小结 | 第22-23页 |
3 差分隐私约束下多方协作集成学习 | 第23-42页 |
3.1 问题描述及挑战 | 第23-24页 |
3.2 系统模型及假设 | 第24页 |
3.3 带差分隐私的多方协作集成学习框架 | 第24-26页 |
3.4 差分隐私约束下的分类与回归树算法 | 第26-28页 |
3.5 差分隐私约束下的随机森林算法 | 第28页 |
3.6 差分隐私约束下的自适应提升算法 | 第28-29页 |
3.7 模型融合 | 第29-30页 |
3.8 理论分析 | 第30-33页 |
3.8.1 隐私性分析 | 第31-32页 |
3.8.2 有效性分析 | 第32-33页 |
3.8.3 时间复杂度和通信开销分析 | 第33页 |
3.9 实验结果 | 第33-41页 |
3.9.1 实验配置 | 第33页 |
3.9.2 数据集简述 | 第33-34页 |
3.9.3 评价指标 | 第34页 |
3.9.4 分类与回归树的高度与融合分类器性能关系 | 第34-38页 |
3.9.5 个性化隐私预算与融合分类器性能的关系 | 第38-40页 |
3.9.6 参与用户个数与系统运行时间关系 | 第40-41页 |
3.10 本章小结 | 第41-42页 |
4 实例研究——广告点击率预估 | 第42-52页 |
4.1 广告点击率简述 | 第42-43页 |
4.2 广告点击率的隐私保护研究成果 | 第43页 |
4.3 广告点击率预估 | 第43-47页 |
4.3.1 KDD2012数据集描述 | 第43-44页 |
4.3.2 直接加入噪声数据 | 第44-45页 |
4.3.3 方案比较 | 第45-47页 |
4.4 网络广告点击率预估系统 | 第47-51页 |
4.4.1 需求分析 | 第47页 |
4.4.2 系统设计 | 第47-49页 |
4.4.3 系统实现 | 第49-51页 |
4.5 本章小结 | 第51-52页 |
5 总结与展望 | 第52-54页 |
5.1 主要总结 | 第52-53页 |
5.2 未来工作展望 | 第53-54页 |
致谢 | 第54-55页 |
参考文献 | 第55-60页 |
附录 | 第60页 |
A. 作者在攻读学位期间发表的论文目录 | 第60页 |
B. 作者在攻读学位期间主持和参与的科研项目 | 第60页 |