差分隐私合成数据发布理论及方法研究
摘要 | 第5-6页 |
Abstract | 第6-7页 |
1 绪论 | 第13-18页 |
1.1 研究背景 | 第13-14页 |
1.2 国内外研究现状及存在的问题分析 | 第14-15页 |
1.3 研究内容和意义 | 第15-16页 |
1.4 本文主要工作及章节安排 | 第16-18页 |
2 隐私保护数据发布技术 | 第18-24页 |
2.1 匿名化隐私保护技术 | 第18-21页 |
2.1.1 数据属性分类 | 第18-19页 |
2.1.2 k-anonymity保护模型 | 第19-21页 |
2.1.3 匿名化技术的局限性 | 第21页 |
2.2 数据扰动技术 | 第21-24页 |
2.2.1 随机化扰动 | 第22页 |
2.2.2 乘法扰动 | 第22-23页 |
2.2.3 数据扰动技术的局限性 | 第23-24页 |
3 差分隐私合成数据发布理论 | 第24-33页 |
3.1 差分隐私保护技术 | 第24-29页 |
3.1.1 差分隐私定义 | 第24-26页 |
3.1.2 全局敏感度 | 第26页 |
3.1.3 差分隐私实现机制 | 第26-29页 |
3.1.3.1 拉普拉斯机制 | 第27-28页 |
3.1.3.2 指数机制 | 第28-29页 |
3.2 合成数据基本概念 | 第29-30页 |
3.3 基于差分隐私的合成数据发布理论 | 第30-33页 |
3.3.1 基于匿名化技术的合成数据发布 | 第30-31页 |
3.3.2 基于学习理论的合成数据集发布 | 第31-32页 |
3.3.3 面向高维度数据集的合成数据发布 | 第32-33页 |
4 基于贝叶斯网络的差分隐私合成数据发布方法 | 第33-47页 |
4.1 贝叶斯网络结构学习 | 第34-43页 |
4.1.1 贝叶斯网络基本概念 | 第34-37页 |
4.1.2 信息熵与互信息 | 第37页 |
4.1.3 基于互信息的贝叶斯网络结构学习算法 | 第37-39页 |
4.1.4 贝叶斯网络结构学习改进算法 | 第39-41页 |
4.1.5 贝叶斯网络精度推理 | 第41-43页 |
4.2 基于贝叶斯网络的合成数据生成算法 | 第43-47页 |
4.2.1 基于贝叶斯网络的非隐私取样算法 | 第43-45页 |
4.2.2 基于贝叶斯网络的差分隐私取样算法 | 第45-47页 |
5 实验分析 | 第47-53页 |
5.1 实验环境 | 第47-48页 |
5.1.1 实验平台 | 第47页 |
5.1.2 实验数据集 | 第47页 |
5.1.3 实验方案 | 第47-48页 |
5.2 实验结果与分析 | 第48-53页 |
5.2.1 贝叶斯网络结构分类精确度分析 | 第48-49页 |
5.2.2 合成数据集可用性分析 | 第49-53页 |
6 总结与展望 | 第53-54页 |
参考文献 | 第54-58页 |
致谢 | 第58-59页 |
作者简介及读研期间主要科研成果 | 第59-60页 |