| 摘要 | 第1-10页 |
| ABSTRACT | 第10-12页 |
| 第1章 绪论 | 第12-19页 |
| ·数据挖掘方法在临床医学上的应用背景 | 第14-16页 |
| ·数据挖掘方法在学术社区挖掘中的相关工作 | 第16-18页 |
| ·本文的组织结构 | 第18-19页 |
| 第2章 决策树和AdaBoost及其在乳腺癌检测上的应用研究 | 第19-35页 |
| ·案例简介——KDD CUP 2008竞赛 | 第19页 |
| ·数据集分析及预处理 | 第19-25页 |
| ·特征选择 | 第20-23页 |
| ·类别不平衡问题 | 第23-25页 |
| ·多实例得分 | 第25页 |
| ·分类模型构建 | 第25-33页 |
| ·基本分类器:基于修正的决策树 | 第27-29页 |
| ·封装器:基于修正的Real AdaBoost | 第29-33页 |
| ·结果及分析 | 第33-34页 |
| ·本章小结 | 第34-35页 |
| 第3章 基于DBLP的学术社区挖掘 | 第35-61页 |
| ·问题描述及主要工作 | 第35-36页 |
| ·基于文献计量学和关键词抽取的学术社区挖掘 | 第36-45页 |
| ·数据准备及工作流程 | 第36-38页 |
| ·基于共享主题和重叠作者的局部社区的构建 | 第38-41页 |
| ·学科社区的构建和特征化方法 | 第41-45页 |
| ·基于DBLP的学术社区挖掘:观察和分析 | 第45-58页 |
| ·基本评估标准 | 第45-46页 |
| ·基于主题和作者的局部社区实例及分析 | 第46-51页 |
| ·各学科社区特征及分析 | 第51-58页 |
| ·本章小结 | 第58-61页 |
| 第4章 总结与展望 | 第61-63页 |
| 参考文献 | 第63-67页 |
| 致谢 | 第67-68页 |
| 攻读硕士学位期间发表的学术论文 | 第68-69页 |
| 攻读硕士学位期间荣获奖励情况 | 第69-70页 |
| 学位论文评阅及答辩情况表 | 第70页 |