开源社区数据挖掘关键技术研究与设计
表目录 | 第1-8页 |
图目录 | 第8-9页 |
摘要 | 第9-10页 |
ABSTRACT | 第10-12页 |
第一章 绪论 | 第12-24页 |
·研究背景 | 第12-16页 |
·开源软件运动 | 第12-13页 |
·开源软件社区 | 第13-14页 |
·开源社区数据 | 第14-16页 |
·开源社区数据挖掘 | 第16-19页 |
·研究意义 | 第17-18页 |
·主要挑战 | 第18-19页 |
·相关研究现状 | 第19-21页 |
·开源社区数据集 | 第19-20页 |
·Web 信息抽取技术 | 第20-21页 |
·社会标签分析技术 | 第21页 |
·本文主要工作 | 第21-24页 |
·本文的主要内容 | 第22-23页 |
·本文的组织结构 | 第23-24页 |
第二章 开源社区数据挖掘平台 | 第24-37页 |
·引言 | 第24-25页 |
·INFLUX 平台体系结构设计 | 第25-27页 |
·INFLUX 平台核心模块设计 | 第27-33页 |
·Web 数据爬取模块 | 第28-31页 |
·软件实体信息抽取模块 | 第31-32页 |
·数据索引模块 | 第32-33页 |
·平台运行状况与初步结果 | 第33-35页 |
·开源社区信息统计 | 第33-34页 |
·跨社区软件搜索 | 第34-35页 |
·数据挖掘服务 | 第35页 |
·小结 | 第35-37页 |
第三章 开源社区软件实体信息抽取算法 | 第37-53页 |
·引言 | 第37-39页 |
·相关工作 | 第39-40页 |
·基于属性重复的软件实体信息抽取算法 | 第40-47页 |
·前提假设 | 第40页 |
·问题定义 | 第40-41页 |
·标签路径 | 第41-42页 |
·案例分析 | 第42-43页 |
·算法设计与实现 | 第43-47页 |
·实验及结果分析 | 第47-51页 |
·数据集 | 第47-48页 |
·实验平台 | 第48-49页 |
·实验过程 | 第49页 |
·同相关工作的对比 | 第49页 |
·相似度阈值的影响 | 第49-51页 |
·种子数据库的影响 | 第51页 |
·讨论与总结 | 第51-53页 |
·讨论及未来工作 | 第51页 |
·小结 | 第51-53页 |
第四章 开源社区软件标签层次挖掘算法 | 第53-68页 |
·标签分类层次 | 第53-54页 |
·相关工作 | 第54-56页 |
·基于 AHC 的标签层次生成算法 | 第56-61页 |
·AHCTC 算法设计与实现 | 第56-60页 |
·AHCTC 与主题模型的集成 | 第60-61页 |
·实验及结果分析 | 第61-66页 |
·数据集与参数设定 | 第62页 |
·基准方法设定 | 第62页 |
·实验结果定性分析 | 第62-65页 |
·实验结果定量评估 | 第65-66页 |
·实验结果讨论 | 第66页 |
·小结 | 第66-68页 |
第五章 总结与展望 | 第68-72页 |
·本文工作总结 | 第68-69页 |
·下一步工作展望 | 第69-72页 |
·第一阶段 | 第69-70页 |
·第二阶段 | 第70页 |
·第三阶段 | 第70-72页 |
致谢 | 第72-74页 |
参考文献 | 第74-78页 |
作者在学期间取得的学术成果 | 第78-80页 |
作者在学期间参与的科研项目 | 第80页 |