高维分类数据的关联关系及可压缩性分析
| 摘要 | 第3-5页 |
| ABSTRACT | 第5-7页 |
| 1 绪论 | 第10-16页 |
| 1.1 研究背景及意义 | 第10-12页 |
| 1.1.1 研究背景 | 第10-11页 |
| 1.1.2 研究意义 | 第11-12页 |
| 1.2 研究现状 | 第12-14页 |
| 1.3 研究的内容及创新 | 第14页 |
| 1.4 论文结构 | 第14-16页 |
| 2 列联表及对数线性模型 | 第16-33页 |
| 2.1 列联表 | 第16-19页 |
| 2.1.1 二维列联表 | 第16-17页 |
| 2.1.2 二维列联表的概率分布 | 第17-18页 |
| 2.1.3 发生比之比 | 第18-19页 |
| 2.2 泊松分布和多项分布 | 第19页 |
| 2.3 三维列联表 | 第19-22页 |
| 2.3.1 条件发生比之比与边际发生比之比 | 第19-21页 |
| 2.3.2 边际独立与条件独立 | 第21-22页 |
| 2.3.3 IJK表 | 第22页 |
| 2.4 列联表的独立检验 | 第22-24页 |
| 2.5 列联表的对数线性模型 | 第24-27页 |
| 2.5.1 二维列联表的对数线性模型 | 第24-25页 |
| 2.5.2 对数发生比之比 | 第25-26页 |
| 2.5.3 三维列联表的对数线性模型 | 第26-27页 |
| 2.6 关联图 | 第27-29页 |
| 2.7 对数线性模型的构建 | 第29-33页 |
| 2.7.1 Akaike信息准则和BIC | 第30-31页 |
| 2.7.2 实例 | 第31-33页 |
| 3 高维分类数据的可压缩性定理及关联图分析 | 第33-59页 |
| 3.1 高维分类数据的可压缩性定理 | 第33-47页 |
| 3.1.1 列联表的三种现象 | 第33页 |
| 3.1.2 可压缩性定理 | 第33-46页 |
| 3.1.3 基于关联图的可压缩性定理 | 第46-47页 |
| 3.2 高维分类数据的变量可压缩性排序 | 第47-59页 |
| 3.2.1 互信息与条件互信息 | 第47-50页 |
| 3.2.2 准则 | 第50-51页 |
| 3.2.3 实例分析 | 第51-59页 |
| 4 Bootstrap下的对数线性模型构建 | 第59-67页 |
| 4.1 引入分类数据下的Bootstrap方法 | 第59-60页 |
| 4.1.1 分类变量的Bootstrap方法 | 第59页 |
| 4.1.2 K- means聚类 | 第59-60页 |
| 4.2 基于Bootstrap下对数线性模型 | 第60-64页 |
| 4.2.1 评价指标 | 第60页 |
| 4.2.2 方法性能分析 | 第60-64页 |
| 4.3 实例应用 | 第64-67页 |
| 5 总结与展望 | 第67-69页 |
| 5.1 研究总结 | 第67-68页 |
| 5.2 研究前景与展望 | 第68-69页 |
| 参考文献 | 第69-72页 |
| 附录 | 第72-73页 |
| 攻读学位期间取得的研究成果 | 第73-74页 |
| 致谢 | 第74-76页 |