面向编程问答网站的主题挖掘及其应用研究
中文摘要 | 第3-5页 |
英文摘要 | 第5-7页 |
1 绪论 | 第10-16页 |
1.1 研究背景及意义 | 第10-12页 |
1.2 国内外研究现状 | 第12-14页 |
1.2.1 非功能需求 | 第12-14页 |
1.2.2 重复问题检测 | 第14页 |
1.3 论文研究内容 | 第14-15页 |
1.4 论文组织结构 | 第15-16页 |
2 相关理论基础 | 第16-28页 |
2.1 Stack Overflow问答网站 | 第16-18页 |
2.2 非功能需求 | 第18-19页 |
2.3 LDA主题模型 | 第19-24页 |
2.3.1 主题模型概述 | 第19-21页 |
2.3.2 LDA模型 | 第21-23页 |
2.3.3 狄利克雷分布 | 第23-24页 |
2.3.4 Gibbs抽样 | 第24页 |
2.4 N-gram模型 | 第24-25页 |
2.5 Mallet工具 | 第25页 |
2.6 统计检验 | 第25-26页 |
2.6.1 kappa一致性检验 | 第26页 |
2.6.2 Spearman等级相关系数 | 第26页 |
2.7 本章小结 | 第26-28页 |
3 数据提取和预处理 | 第28-32页 |
3.1 数据提取 | 第28-31页 |
3.2 数据预处理 | 第31页 |
3.3 本章小结 | 第31-32页 |
4 基于主题模型的非功能需求关注研究 | 第32-50页 |
4.1 基于主题模型的非功能需求标注方法 | 第33-36页 |
4.1.1 构建主题模型 | 第33-34页 |
4.1.2 非功能需求标注 | 第34-36页 |
4.1.3 构建验证数据集 | 第36页 |
4.2 实验结果及分析 | 第36-49页 |
4.2.1 方法准确性评估 | 第37-38页 |
4.2.2 定义度量元 | 第38-39页 |
4.2.3 RQ1非功能需求热点问题 | 第39-41页 |
4.2.4 RQ2遗留问题下的非功能需求关注 | 第41-42页 |
4.2.5 RQ3非功能需求热点演化趋势 | 第42-46页 |
4.2.6 RQ4非功能需求难点问题 | 第46-47页 |
4.2.7 RQ5非功能需求难点演化趋势 | 第47-49页 |
4.3 本章小结 | 第49-50页 |
5 基于主题模型的重复问题检测 | 第50-63页 |
5.1 DupLNG重复问题检测方法 | 第51-57页 |
5.1.1 LDA重复问题检测 | 第51-52页 |
5.1.2 N-gram重复问题检测 | 第52-54页 |
5.1.3 DupLNG重复问题检测 | 第54-57页 |
5.2 实验结果及分析 | 第57-62页 |
5.2.1 实验结果评估标准 | 第57页 |
5.2.2 实验结果评估和分析 | 第57-62页 |
5.3 本章小结 | 第62-63页 |
6 总结与展望 | 第63-65页 |
6.1 总结 | 第63-64页 |
6.2 展望 | 第64-65页 |
致谢 | 第65-66页 |
参考文献 | 第66-71页 |
附录 | 第71-72页 |
A. 作者在攻读学位期间发表的论文目录 | 第71页 |
B. 作者在攻读学位期间取得的科研成果目录 | 第71-72页 |