中文摘要 | 第3-5页 |
英文摘要 | 第5-7页 |
1 绪论 | 第11-25页 |
1.1 研究背景与意义 | 第11-13页 |
1.2 相关研究进展 | 第13-21页 |
1.2.1 软件维护工作量预测 | 第14-16页 |
1.2.2 软件变更预测 | 第16-18页 |
1.2.3 软件缺陷预测 | 第18-21页 |
1.3 研究动机 | 第21-22页 |
1.4 本文主要研究内容 | 第22-23页 |
1.5 论文组织结构 | 第23-25页 |
2 相关理论与技术 | 第25-37页 |
2.1 软件仓库挖掘 | 第25-26页 |
2.2 软件维护工作量预测 | 第26-28页 |
2.3 变更(change-prone) 预测与缺陷 (defect-prone) 预测 | 第28-32页 |
2.3.1 静态预测技术 | 第29-31页 |
2.3.2 软件缺陷动态预测技术 | 第31-32页 |
2.4 自学习 | 第32-33页 |
2.5 主题模型 | 第33-36页 |
2.5.1 主题模型概述 | 第33-34页 |
2.5.2 LDA模型 | 第34-35页 |
2.5.3 狄利克雷分布 | 第35-36页 |
2.5.4 Gibbs抽样 | 第36页 |
2.6 本章小结 | 第36-37页 |
3 软件维护工作量预测模型 | 第37-53页 |
3.1 引入 | 第37-38页 |
3.2 回归模型 | 第38-40页 |
3.2.1 线性回归 | 第39页 |
3.2.2 多元线性回归 | 第39-40页 |
3.3 RPBSC模型 | 第40-44页 |
3.3.1 软件维护工作量度量指标选取 | 第40-43页 |
3.3.2 源代码版本数量的充分必要性 | 第43页 |
3.3.3 RPBSC模型的建立 | 第43-44页 |
3.4 实验设计及结果分析 | 第44-51页 |
3.4.1 实验环境 | 第44-45页 |
3.4.2 数据来源 | 第45-46页 |
3.4.3 指标及数据 | 第46-47页 |
3.4.4 实验结果与分析 | 第47-51页 |
3.5 本章小结 | 第51-53页 |
4 基于自学习的软件变更预测模型 | 第53-77页 |
4.1 引入 | 第53-56页 |
4.2 基于自学习的软件变更预测模型的建立 | 第56-62页 |
4.2.1 聚类与标记 | 第57-61页 |
4.2.2 选择度量元 | 第61页 |
4.2.3 实例选择 | 第61-62页 |
4.2.4 学习与预测 | 第62页 |
4.3 实验设计 | 第62-65页 |
4.3.1 研究问题 | 第62页 |
4.3.2 实验环境 | 第62-63页 |
4.3.3 数据集 | 第63-64页 |
4.3.4 实验对比 | 第64-65页 |
4.3.5 评估指标 | 第65页 |
4.4 实验结果与分析 | 第65-75页 |
4.4.1 实验结果 | 第66-75页 |
4.4.2 问题回答 | 第75页 |
4.4.3 实验讨论 | 第75页 |
4.5 本章小结 | 第75-77页 |
5 基于LDA的软件组件缺陷预测模型 | 第77-99页 |
5.1 引入 | 第77-79页 |
5.2 潜在的狄利克雷分布(LDA) | 第79-81页 |
5.3 基于LDA的软件组件缺陷预测模型的建立 | 第81-91页 |
5.3.1 数据抽取及预处理 | 第82-87页 |
5.3.2 主题个数选择 | 第87-88页 |
5.3.3 计算主题缺陷密度 | 第88-89页 |
5.3.4 缺陷模块预测 | 第89-91页 |
5.4 实验设计 | 第91-95页 |
5.4.1 实验环境 | 第91页 |
5.4.2 实验数据集 | 第91-92页 |
5.4.3 实验过程 | 第92-95页 |
5.4.4 评估指标 | 第95页 |
5.5 实验结果与分析 | 第95-98页 |
5.5.1 Mylyn实验结果 | 第95-97页 |
5.5.2 Ant实验结果 | 第97页 |
5.5.3 Platform实验结果 | 第97-98页 |
5.5.4 Spearman系数 | 第98页 |
5.6 本章小结 | 第98-99页 |
6 总结与展望 | 第99-103页 |
6.1 总结 | 第99-100页 |
6.2 展望 | 第100-103页 |
致谢 | 第103-105页 |
参考文献 | 第105-115页 |
附录 | 第115页 |
A 作者在攻读博士学位期间发表(录用)论文 | 第115页 |
B 作者在攻读博士学位期间参与的科研项目 | 第115页 |