首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

软件工程数据挖掘若干问题研究

摘要第3-5页
Abstract第5-6页
第一章 绪论第14-36页
    1.1 软件工程数据挖掘简介及意义第14页
    1.2 相关研究进展第14-33页
        1.2.1 代码编写第16-20页
        1.2.2 提交修改第20-22页
        1.2.3 缺陷分派第22-24页
        1.2.4 缺陷重现第24-25页
        1.2.5 理解程序第25-32页
        1.2.6 设计推究第32-33页
    1.3 本文研究内容第33-34页
    1.4 论文结构第34-36页
第二章 程序命名预测第36-48页
    2.1 引言第36-38页
    2.2 背景知识第38-40页
        2.2.1 Java Method第38页
        2.2.2 文本分类技术第38-40页
    2.3 方法第40-42页
        2.3.1 技术路线第40页
        2.3.2 分析器第40页
        2.3.3 特征匹配器第40-42页
        2.3.4 词性标注器第42页
        2.3.5 SVM分类器第42页
    2.4 实验第42-45页
        2.4.1 实验配置第43页
        2.4.2 实验效果第43-44页
        2.4.3 符号特征与数值特征第44-45页
        2.4.4 进一步验证第45页
    2.5 讨论第45-47页
    2.6 小结第47-48页
第三章 TPLAG:一种高效且健壮的代码剽窃检测方法第48-72页
    3.1 引言第48-49页
    3.2 基于TDG的代码剽窃检测第49-56页
        3.2.1 类型依赖图第50-54页
        3.2.2 近似子图匹配第54-55页
        3.2.3 流关系的度量(FRS)第55-56页
        3.2.4 代码剽窃检测的搜素空间修剪第56页
        3.2.5 TPLAG的实现第56页
    3.3 算法分析第56-61页
        3.3.1 剽窃伪装第57-58页
        3.3.2 有效性第58-60页
        3.3.3 效率第60-61页
            3.3.3.1 子图匹配第60页
            3.3.3.2 FRS计算第60-61页
    3.4 实验结果第61-68页
        3.4.1 实验配置第62页
            3.4.1.1 实验数据第62页
            3.4.1.2 生成TDG的配置第62页
            3.4.1.3 近似子图匹配的配置第62页
        3.4.2 TPLAG的健壮性分析第62-65页
        3.4.3 TPLAG的效率第65-67页
        3.4.4 过滤器的效率第67-68页
    3.5 讨论第68-70页
        3.5.1 TPLAG的查准率第68页
        3.5.2 TPLAG的扩展第68-69页
        3.5.3 为何提出TDG模型?第69页
        3.5.4 TDG的无歧义性第69-70页
        3.5.5 可能影响TPLAG的伪装方法第70页
    3.6 小结第70-72页
第四章 基于LDA的缺陷分派第72-82页
    4.1 引言第72-73页
    4.2 背景第73-75页
        4.2.1 缺陷报告第73-74页
        4.2.2 LDA主题模型第74-75页
    4.3 方法第75-76页
    4.4 实验第76-79页
    4.5 讨论第79-81页
        4.5.1 为何分派的准确率较低?第79-80页
        4.5.2 为何LDA的最佳维度数高于LSA?第80页
        4.5.3 LDA是否比LSA更有效率?第80-81页
        4.5.4 LDA为何有效?第81页
    4.6 结论与展望第81-82页
第五章 基于主题模型的软件缺陷报告质量评估第82-92页
    5.1 引言第82-83页
    5.2 方法第83-84页
        5.2.1 预处理第83页
        5.2.2 主题模型的应用第83-84页
        5.2.3 主题质量评估第84页
        5.2.4 缺陷报告质量评估第84页
    5.3 实验评价第84-89页
        5.3.1 实验配置第84-85页
        5.3.2 主题质量评估第85-86页
        5.3.3 缺陷分派第86-87页
        5.3.4 缺陷报告质量评估第87-89页
    5.4 结论第89-92页
第六章 缺陷报告上的主题发现和事件跟踪第92-110页
    6.1 引言第92-93页
    6.2 背景知识第93-94页
        6.2.1 缺陷报告第93-94页
        6.2.2 事件检测第94页
            6.2.2.1 时间序列第94页
            6.2.2.2 为何要检测显著事件?第94页
    6.3 缺陷报告上的主题分析第94-97页
        6.3.1 在缺陷报告上应用LDA第95页
        6.3.2 建立主题时间序列第95-96页
        6.3.3 主题序列上的事件检测第96页
        6.3.4 实验配置第96-97页
    6.4 实验第97-105页
        6.4.1 Eclipse beta上的显著主题第98-99页
        6.4.2 Eclipse 1.0上的显著主题第99-100页
        6.4.3 Eclipse 2.0上的显著主题第100-102页
        6.4.4 Eclipse 2.1上的显著主题第102-103页
        6.4.5 Eclipse 3.0上的显著主题第103-104页
        6.4.6 不显著主题第104-105页
    6.5 讨论第105-107页
        6.5.1 本文的方法为何有效?第105-106页
        6.5.2 实际应用第106-107页
            6.5.2.1 主题跟踪第107页
            6.5.2.2 事件预测第107页
    6.6 结论与展望第107-110页
第七章 结论与展望第110-116页
    7.1 本文工作的总结第110页
    7.2 未来工作的展望第110-116页
        7.2.1 现有问题的高性能算法第112-113页
        7.2.2 复杂问题的解决方案第113-114页
        7.2.3 海量数据的挖掘算法第114页
        7.2.4 针对软件工程新理念的挖掘第114页
        7.2.5 数据挖掘新技术的引入第114-116页
参考文献第116-134页
发表/录用论文第134页
已投稿论文第134-136页
致谢第136-137页

论文共137页,点击 下载论文
上一篇:基础地理信息时空一体化建模与管理方法研究
下一篇:中国个人养老年金税收优惠政策研究