面向编程问答网站的主题挖掘及其应用研究

中文摘要	第3-5页
英文摘要	第5-7页
1 绪论	第10-16页
1.1 研究背景及意义	第10-12页
1.2 国内外研究现状	第12-14页
1.2.1 非功能需求	第12-14页
1.2.2 重复问题检测	第14页
1.3 论文研究内容	第14-15页
1.4 论文组织结构	第15-16页
2 相关理论基础	第16-28页
2.1 Stack Overflow问答网站	第16-18页
2.2 非功能需求	第18-19页
2.3 LDA主题模型	第19-24页
2.3.1 主题模型概述	第19-21页
2.3.2 LDA模型	第21-23页
2.3.3 狄利克雷分布	第23-24页
2.3.4 Gibbs抽样	第24页
2.4 N-gram模型	第24-25页
2.5 Mallet工具	第25页
2.6 统计检验	第25-26页
2.6.1 kappa一致性检验	第26页
2.6.2 Spearman等级相关系数	第26页
2.7 本章小结	第26-28页
3 数据提取和预处理	第28-32页
3.1 数据提取	第28-31页
3.2 数据预处理	第31页
3.3 本章小结	第31-32页
4 基于主题模型的非功能需求关注研究	第32-50页
4.1 基于主题模型的非功能需求标注方法	第33-36页
4.1.1 构建主题模型	第33-34页
4.1.2 非功能需求标注	第34-36页
4.1.3 构建验证数据集	第36页
4.2 实验结果及分析	第36-49页
4.2.1 方法准确性评估	第37-38页
4.2.2 定义度量元	第38-39页
4.2.3 RQ1非功能需求热点问题	第39-41页
4.2.4 RQ2遗留问题下的非功能需求关注	第41-42页
4.2.5 RQ3非功能需求热点演化趋势	第42-46页
4.2.6 RQ4非功能需求难点问题	第46-47页
4.2.7 RQ5非功能需求难点演化趋势	第47-49页
4.3 本章小结	第49-50页
5 基于主题模型的重复问题检测	第50-63页
5.1 DupLNG重复问题检测方法	第51-57页
5.1.1 LDA重复问题检测	第51-52页
5.1.2 N-gram重复问题检测	第52-54页
5.1.3 DupLNG重复问题检测	第54-57页
5.2 实验结果及分析	第57-62页
5.2.1 实验结果评估标准	第57页
5.2.2 实验结果评估和分析	第57-62页
5.3 本章小结	第62-63页
6 总结与展望	第63-65页
6.1 总结	第63-64页
6.2 展望	第64-65页
致谢	第65-66页
参考文献	第66-71页
附录	第71-72页
A. 作者在攻读学位期间发表的论文目录	第71页
B. 作者在攻读学位期间取得的科研成果目录	第71-72页