首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于LDA模型的重复缺陷报告检测的研究

摘要第3-5页
ABSTRACT第5-6页
1 绪论第9-13页
    1.1 研究背景与意义第9-10页
    1.2 国内外研究现状第10-11页
    1.3 论文研究内容第11-12页
    1.4 论文组织结构第12-13页
2 相关理论基础第13-26页
    2.1 软件缺陷概述第13-14页
    2.2 软件缺陷跟踪系统—Bugzilla第14-18页
        2.2.1 Bugzilla 系统简介第14-15页
        2.2.2 Bug 生命周期第15-17页
        2.2.3 Bugzilla 系统工作流程第17-18页
    2.3 主题模型理论基础第18-23页
        2.3.1 概述第18-20页
        2.3.2 潜在语义分析第20-21页
        2.3.3 概率潜在语义分析第21-23页
    2.4 Mallet 相关理论第23-24页
    2.5 GATE 框架第24-25页
    2.6 本章小结第25-26页
3 缺陷报告数据抽取及预处理第26-40页
    3.1 构建实验样本空间第26-28页
    3.2 缺陷报告数据抽取第28-33页
        3.2.1 缺陷报告数据格式第28-30页
        3.2.2 缺陷报告数据抽取第30-33页
    3.3 实验数据预处理第33-39页
        3.3.1 去除无效缺陷和描述语句第34-36页
        3.3.2 分词,提取词干,删除停用词第36-39页
    3.4 本章小结第39-40页
4 基于向量空间模型的重复缺陷报告检测第40-50页
    4.1 向量空间模型第40-42页
        4.1.1 向量空间模型概述第40页
        4.1.2 向量空间模型算法原理第40-42页
    4.2 基于向量空间模型的重复缺陷报告检测第42-47页
        4.2.1 特征项选取和权重计算第42-45页
        4.2.2 缺陷报告相似度计算第45-47页
    4.3 实验结果评估第47-49页
    4.4 本章小结第49-50页
5 基于 LDA 的重复缺陷报告检测第50-72页
    5.1 LDA 模型第50-55页
        5.1.1 概述第50-52页
        5.1.2 LDA 算法原理第52-55页
    5.2 基于 LDA 的重复缺陷报告检测第55-66页
        5.2.1 利用 LDA 构建主题模型第56-58页
        5.2.2 构建测试样本空间第58-60页
        5.2.3 缺陷报告执行信息相似度计算第60-61页
        5.2.4 缺陷报告分类信息相似度计算第61-64页
        5.2.5 缺陷报告最终相似度结果第64-66页
    5.3 实验结果评估第66-71页
        5.3.1 实验结果评估标准第66-67页
        5.3.2 实验结果评估第67-71页
    5.4 本章小结第71-72页
6 结论与展望第72-74页
    6.1 结论第72页
    6.2 展望第72-74页
致谢第74-75页
参考文献第75-77页
附录第77页
    A. 作者在攻读学位期间发表的论文目录第77页

论文共77页,点击 下载论文
上一篇:基于路径优化的保山市烟草专卖公司卷烟配送流程研究--Take Baoshan Tobacco Monopoly Administration as Example
下一篇:基于频繁模式的离群点挖掘在入侵检测中的应用