统计显著子图发现及其应用

摘要	第2-3页
Abstract	第3页
1 绪论	第6-11页
1.1 子图发现问题概述	第6页
1.2 图聚类研究现状	第6-7页
1.3 稠密子图发现研究现状	第7-8页
1.4 统计显著子图发现研究现状	第8-10页
1.5 研究动机与本文主要贡献	第10-11页
2 相关技术	第11-18页
2.1 随机图生成方法	第11-13页
2.1.1 Erd?s–Rényi model	第11页
2.1.2 Configuration model	第11-12页
2.1.3 LFR benchmark模型	第12-13页
2.2 假设检验	第13-15页
2.3 错误率控制	第15-16页
2.4 Fisher’s exact test	第16-18页
3 统计显著子图发现算法	第18-35页
3.1 问题描述	第18页
3.2 相关定义	第18-22页
3.2.1 单个节点的p-value计算	第18-20页
3.2.2 加速技术	第20-21页
3.2.3 p-value的计算方法	第21-22页
3.3 算法描述	第22-27页
3.3.1 寻找单个统计显著子图	第24-26页
3.3.3 结果后处理	第26-27页
3.4 仿真数据实验	第27-32页
3.4.1 评价指标	第28页
3.4.2 无社区结构网络	第28-29页
3.4.3 多社区网络	第29-32页
3.5 真实数据实验	第32-35页
3.5.1 数据集介绍	第32页
3.5.2 实验结果评估	第32-35页
4 算法应用	第35-56页
4.1 蛋白质复合物发现问题	第35-37页
4.1.1 蛋白质复合物发现相关背景及研究现状	第35-36页
4.1.2 蛋白质复合物发现评估方法	第36-37页
4.2 数据描述	第37-39页
4.3 参数设置	第39页
4.4 实验结果	第39-46页
4.4.1 NMI	第39-40页
4.4.2 综合评价指标	第40-43页
4.4.3 F1 score	第43-45页
4.4.4 实验结果总结	第45-46页
4.5 统计显著子图发现对比实验	第46-48页
4.6 FWER vs FDR	第48-51页
4.7 超几何分布vs二项分布	第51-53页
4.8 参数的敏感性	第53-56页
结论	第56-57页
参考文献	第57-62页
攻读硕士学位期间发表学术论文情况	第62-63页
致谢	第63-65页