高维分类数据的关联关系及可压缩性分析
摘要 | 第3-5页 |
ABSTRACT | 第5-7页 |
1 绪论 | 第10-16页 |
1.1 研究背景及意义 | 第10-12页 |
1.1.1 研究背景 | 第10-11页 |
1.1.2 研究意义 | 第11-12页 |
1.2 研究现状 | 第12-14页 |
1.3 研究的内容及创新 | 第14页 |
1.4 论文结构 | 第14-16页 |
2 列联表及对数线性模型 | 第16-33页 |
2.1 列联表 | 第16-19页 |
2.1.1 二维列联表 | 第16-17页 |
2.1.2 二维列联表的概率分布 | 第17-18页 |
2.1.3 发生比之比 | 第18-19页 |
2.2 泊松分布和多项分布 | 第19页 |
2.3 三维列联表 | 第19-22页 |
2.3.1 条件发生比之比与边际发生比之比 | 第19-21页 |
2.3.2 边际独立与条件独立 | 第21-22页 |
2.3.3 IJK表 | 第22页 |
2.4 列联表的独立检验 | 第22-24页 |
2.5 列联表的对数线性模型 | 第24-27页 |
2.5.1 二维列联表的对数线性模型 | 第24-25页 |
2.5.2 对数发生比之比 | 第25-26页 |
2.5.3 三维列联表的对数线性模型 | 第26-27页 |
2.6 关联图 | 第27-29页 |
2.7 对数线性模型的构建 | 第29-33页 |
2.7.1 Akaike信息准则和BIC | 第30-31页 |
2.7.2 实例 | 第31-33页 |
3 高维分类数据的可压缩性定理及关联图分析 | 第33-59页 |
3.1 高维分类数据的可压缩性定理 | 第33-47页 |
3.1.1 列联表的三种现象 | 第33页 |
3.1.2 可压缩性定理 | 第33-46页 |
3.1.3 基于关联图的可压缩性定理 | 第46-47页 |
3.2 高维分类数据的变量可压缩性排序 | 第47-59页 |
3.2.1 互信息与条件互信息 | 第47-50页 |
3.2.2 准则 | 第50-51页 |
3.2.3 实例分析 | 第51-59页 |
4 Bootstrap下的对数线性模型构建 | 第59-67页 |
4.1 引入分类数据下的Bootstrap方法 | 第59-60页 |
4.1.1 分类变量的Bootstrap方法 | 第59页 |
4.1.2 K- means聚类 | 第59-60页 |
4.2 基于Bootstrap下对数线性模型 | 第60-64页 |
4.2.1 评价指标 | 第60页 |
4.2.2 方法性能分析 | 第60-64页 |
4.3 实例应用 | 第64-67页 |
5 总结与展望 | 第67-69页 |
5.1 研究总结 | 第67-68页 |
5.2 研究前景与展望 | 第68-69页 |
参考文献 | 第69-72页 |
附录 | 第72-73页 |
攻读学位期间取得的研究成果 | 第73-74页 |
致谢 | 第74-76页 |