面向源码的功能定位技术研究
摘要 | 第5-6页 |
Abstract | 第6页 |
第1章 绪论 | 第10-16页 |
1.1 研究背景和意义 | 第10-11页 |
1.2 国内外研究现状 | 第11-14页 |
1.3 研究内容 | 第14-15页 |
1.4 论文组织结构 | 第15-16页 |
第2章 软件聚类和信息检索相关技术研究 | 第16-30页 |
2.1 简介 | 第16页 |
2.2 常见聚类算法研究 | 第16-23页 |
2.2.1 划分聚类算法 | 第16-20页 |
2.2.2 基于层次的聚类算法 | 第20-22页 |
2.2.3 基于约束的聚类算法 | 第22页 |
2.2.4 和机器学习相关的聚类算法 | 第22页 |
2.2.5 聚类算法比较 | 第22-23页 |
2.3 软件聚类技术研究 | 第23-26页 |
2.3.1 聚类对象描述 | 第23页 |
2.3.2 形式化分析聚类对象描述 | 第23-24页 |
2.3.3 非形式化聚类对象描述 | 第24页 |
2.3.4 多视图聚类对象描述 | 第24-25页 |
2.3.5 聚类策略研究 | 第25-26页 |
2.3.6 目标函数 | 第26页 |
2.4 信息检索技术研究 | 第26-28页 |
2.4.1 VSM | 第26页 |
2.4.2 LSI | 第26-28页 |
2.5 本章小结 | 第28-30页 |
第3章 系统架构设计及功能搜索算法研究 | 第30-42页 |
3.1 系统架构设计 | 第30-32页 |
3.2 功能搜索模块研究和实现 | 第32-35页 |
3.2.1 输入集合构造 | 第33页 |
3.2.2 提取类名及作用域 | 第33-34页 |
3.2.3 类文件信息提取 | 第34页 |
3.2.4 类中成员提取 | 第34-35页 |
3.2.5 类中注释提取 | 第35页 |
3.3 LSI算法应用 | 第35-39页 |
3.3.1 余弦相似性 | 第36-37页 |
3.3.2 SVD-奇异值分解 | 第37-38页 |
3.3.3 TF-IDF | 第38-39页 |
3.4 LSI算法使用流程 | 第39-41页 |
3.5 本章小结 | 第41-42页 |
第4章 基于类的软件聚类算法研究 | 第42-54页 |
4.1 聚类实体特征选取 | 第42-43页 |
4.1.1 实体选取 | 第42-43页 |
4.1.2 特征选取 | 第43页 |
4.2 基于类描述的特征选取 | 第43-49页 |
4.2.1 类泛化关系特征 | 第43-45页 |
4.2.2 类实现关系特征 | 第45页 |
4.2.3 类依赖关系特征 | 第45-46页 |
4.2.4 类关联关系特征 | 第46页 |
4.2.5 文件依赖关系特征 | 第46-47页 |
4.2.6 包关系特征 | 第47页 |
4.2.7 变量名称特征 | 第47-48页 |
4.2.8 文件名称特征 | 第48页 |
4.2.9 附加特性的商榷 | 第48-49页 |
4.3 凝聚式层次聚类算法 | 第49-53页 |
4.3.1 聚类实体距离矩阵构造 | 第49-50页 |
4.3.2 簇间距离计算 | 第50-51页 |
4.3.3 软件聚类算法流程 | 第51-53页 |
4.4 本章小结 | 第53-54页 |
第5章 源码功能定位实验分析 | 第54-64页 |
5.1 实验环境介绍 | 第54页 |
5.2 软件聚类算法比较 | 第54-57页 |
5.2.1 开源系统特性 | 第54-55页 |
5.2.2 MoJo距离 | 第55-56页 |
5.2.3 特征参数聚类结果的影响 | 第56-57页 |
5.2.4 相似度函数 | 第57页 |
5.3 软件聚类结果比较 | 第57-59页 |
5.4 基于类信息的源码搜索 | 第59-60页 |
5.5 整体实验验证 | 第60-63页 |
5.6 本章小结 | 第63-64页 |
结论 | 第64-66页 |
参考文献 | 第66-72页 |
攻读硕士学位期间发表的论文和取得的科研成果 | 第72-74页 |
致谢 | 第74页 |