摘要 | 第1-8页 |
Abstract | 第8-14页 |
第一章 引言 | 第14-18页 |
·引言 | 第14-15页 |
·糖尿病并发末梢神经病变发病及研究现状 | 第14页 |
·数据挖掘方法与统计学方法简介 | 第14-15页 |
·数据挖掘方法与统计学方法在医学领域预测性能比较研究现状 | 第15页 |
·本论文主要的研究内容 | 第15-18页 |
·本论文研究中的难点 | 第15-16页 |
·本论文的主要研究内容和结构安排 | 第16-18页 |
第二章 数据来源与数据库整理 | 第18-29页 |
·本章引论 | 第18页 |
·数据来源 | 第18页 |
·数据整理 | 第18-25页 |
·对变量进行描述 | 第25-28页 |
·定量变量统计描述 | 第25页 |
·定性变量统计描述 | 第25-28页 |
·小结 | 第28-29页 |
第三章 三种预测模型及泛化能力评价方法等的简介 | 第29-44页 |
·本章引论 | 第29页 |
·预测模型简介 | 第29-37页 |
·Logistic 回归 | 第29-31页 |
·决策树 | 第31-35页 |
·神经网络 | 第35-37页 |
·过抽样简介 | 第37-38页 |
·ROC曲线简介 | 第38-41页 |
·模型泛化能力的评价及三种Monte Carlo模拟抽样方法的应用 | 第41-43页 |
·软件实现 | 第43页 |
·本章小结 | 第43-44页 |
第四章 三种预测模型建模过程及建模结果 | 第44-61页 |
·本章引论 | 第44页 |
·Logistic回归建模过程及结果 | 第44-53页 |
·变量选择 | 第44-48页 |
·模型建立 | 第48-53页 |
·先验概率调整 | 第53页 |
·决策树建模过程及结果 | 第53-56页 |
·变量选择 | 第53-54页 |
·交叉验证法建立模型 | 第54-56页 |
·神经网络建模过程及结果 | 第56-58页 |
·变量选择 | 第56-57页 |
·确定隐含层数 | 第57页 |
·隐含层节点数及跳跃层的确定 | 第57-58页 |
·构造MLP模型 | 第58页 |
·三个模型拟合原始数据后的ROC面积比较的结果 | 第58-59页 |
·最佳分割点 | 第59-60页 |
·小结 | 第60-61页 |
第五章 三种模型预测性能比较结果 | 第61-111页 |
·本章引论 | 第61页 |
·分层交叉验证的比较结果 | 第61-102页 |
·分层交叉验证的流程 | 第61-62页 |
·2 折分层交叉验证的结果 | 第62-66页 |
·3 折分层交叉验证的结果 | 第66-71页 |
·4 折分层交叉验证的结果 | 第71-75页 |
·5 折分层交叉验证的结果 | 第75-79页 |
·6 折分层交叉验证的结果 | 第79-84页 |
·7 折分层交叉验证的结果 | 第84-88页 |
·8 折分层交叉验证的结果 | 第88-92页 |
·9 折分层交叉验证的结果 | 第92-97页 |
·10 折分层交叉验证的结果 | 第97-101页 |
·10 次~100 次2 折~10 折分层交叉验证ROC面积大小变化示意图 | 第101-102页 |
·刀切法比较结果 | 第102-103页 |
·刀切法对模型泛化能力评价实现流程 | 第102-103页 |
·刀切法验证后ROC面积大小比较结果 | 第103页 |
·三种方法100~1000 次自引导法ROC面积比较的结果 | 第103-109页 |
·自引导法对模型泛化能力评价实现流程 | 第104页 |
·自引导法ROC面积大小比较结果 | 第104-109页 |
·100 次~1000 次自引导法ROC面积大小变化示意图 | 第109页 |
·小结 | 第109-111页 |
第六章 讨论 | 第111-116页 |
·三种Monte Carlo抽样方法进行泛化能力结果的比较 | 第111-112页 |
·三种模型的优缺点 | 第112-113页 |
·MLP优化算法比较 | 第113页 |
·过抽样的影响 | 第113-114页 |
·Logistic回归分析中变量筛选方法 | 第114页 |
·各种方法相互借鉴 | 第114-116页 |
第七章 总结和展望 | 第116-118页 |
·本论文的主要工作和贡献 | 第116-117页 |
·进一步工作的展望 | 第117-118页 |
参考文献 | 第118-123页 |
附录1 变量的定义及赋值方法 | 第123-125页 |
附录2 主要程序代码 | 第125-133页 |
致谢 | 第133-134页 |
个人学习经历、工作情况、发表文章及参编著作 | 第134-137页 |
综述 | 第137-144页 |