基于互信息的变量选择方法研究

摘要	第4-5页
Abstract	第5页
1 绪论	第8-15页
1.1 引言	第8页
1.2 多变量建模方法	第8-10页
1.2.1 最小二乘法	第9页
1.2.2 偏最小二乘法	第9-10页
1.3 变量选择方法	第10-11页
1.3.1 子集选择法	第10-11页
1.3.2 系数压缩法	第11页
1.4 判别分析法	第11-12页
1.5 模型评价方法	第12-13页
1.5.1 独立测试集法	第12-13页
1.5.2 交互检验法	第13页
1.6 本文的主要研究内容	第13-15页
2 基于互信息的模型集群分析变量选择方法	第15-33页
2.1 引言	第15页
2.2 原理和算法	第15-21页
2.2.1 熵与互信息	第16-17页
2.2.2 基于互信息的变量选择方法回顾	第17-19页
2.2.3 本文提出的MPA-MMIFS算法	第19-21页
2.3 MPA-MMIFS计算软件	第21页
2.4 实验数据	第21-24页
2.4.1 基因组学数据(乳腺癌)	第22页
2.4.2 代谢组学数据(Ⅱ型糖尿病)	第22-23页
2.4.3 近红外数据(食用醋)	第23-24页
2.5 数据处理	第24-25页
2.6 结果与讨论	第25-31页
2.6.1 Estrogen数据	第25-27页
2.6.2 T2DM数据	第27-29页
2.6.3 Vinegar数据	第29-31页
2.7 本章小结	第31-33页
3 变量选择方法之间的比较	第33-41页
3.1 引言	第33页
3.2 其他变量选择方法	第33-38页
3.2.1 遗传算法(GA)	第33-35页
3.2.2 间隔影响分析法(MIA)	第35页
3.2.3 随机青蛙算法(RF)	第35-36页
3.2.4 子窗口重排分析法(SPA)	第36页
3.2.5 变量互补信息网(VCN)	第36-37页
3.2.6 竞争性自适应重加权采样法(CARS)	第37-38页
3.3 不同方法的计算结果比较	第38-40页
3.3.1 Estrogen数据	第38-39页
3.3.2 T2DM数据	第39页
3.3.3 Vinegar数据	第39-40页
3.4 本章小结	第40-41页
4 MPA-MMIFS算法的参数优化	第41-45页
4.1 引言	第41页
4.2 k值与Q值的优化	第41-43页
4.3 β值的优化	第43页
4.4 N的取值对MPA-MMIFS算法的影响	第43-44页
4.5 本章小结	第44-45页
结论与展望	第45-46页
参考文献	第46-50页
附录	第50-52页
攻读学位期间主要的研究成果	第52-53页
致谢	第53页