首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向开源社区的Web数据抽取与挖掘关键技术研究

摘要第1-12页
Abstract第12-15页
第一章 绪论第15-35页
   ·研究背景第15-21页
     ·基于 Web 的开源社区的流行第15-18页
     ·开源社区 Web 数据挖掘的应用需求第18-20页
     ·开源社区 Web 数据挖掘的挑战第20-21页
   ·研究现状第21-28页
     ·软件资源库挖掘技术第21-23页
     ·Web 信息抽取技术第23-24页
     ·Web 数据挖掘技术第24-26页
     ·信息网络分析技术第26-28页
   ·研究内容与研究成果第28-33页
     ·本文的研究内容第28-31页
     ·本文的研究成果第31-33页
   ·论文结构第33-35页
第二章 基于缩进轮廓的单网页列表信息抽取算法第35-51页
   ·引言第35-37页
   ·相关工作第37-38页
   ·缩进轮廓模型第38-43页
     ·缩进轮廓和缩进波段第39-40页
     ·串联重复波段第40-43页
   ·缩进轮廓的串联重复波段挖掘算法第43-46页
   ·数据区域的识别与信息抽取第46-48页
   ·实验及结果分析第48-50页
   ·本章小结第50-51页
第三章 基于重复内容的异构多网页信息抽取算法第51-71页
   ·引言第51-53页
   ·相关工作第53-55页
   ·问题描述第55-57页
   ·异构多网页信息抽取算法第57-64页
     ·构建种子属性集合第58-59页
     ·属性标注与定位第59-62页
     ·属性抽取第62-64页
   ·实验及结果分析第64-70页
   ·本章小结第70-71页
第四章 开源社区开发者合作关系网络实体排序算法第71-91页
   ·引言第71-73页
   ·相关工作第73-74页
   ·马尔可夫链上的随机游走模型第74-75页
   ·主题和时间敏感的排序算法第75-80页
     ·主题和时间敏感的合作关系网络模型第75-77页
     ·主题时间函数第77-80页
     ·TTS-Rank 算法第80页
   ·实验及结果分析第80-88页
     ·开发人员合作关系网络的网络属性第81-84页
     ·试验过程及结果分析第84-88页
     ·讨论第88页
   ·本章小结第88-91页
第五章 基于在线增量演化主题模型的软件自动分类算法第91-127页
   ·引言第91-95页
   ·相关工作第95-98页
     ·基于监督学习的软件自动分类第95-96页
     ·基于非监督学习的软件自动分类第96页
     ·文本主题发现与在线演化第96-98页
   ·基于 LDA 的在线增量演化主题模型第98-112页
     ·LDA 主题模型第98-100页
     ·Gibbs 抽样第100-104页
     ·在线增量演化主题模型第104-112页
   ·开源社区软件自动分类与主题自动标注算法第112-114页
   ·实验及结果分析第114-125页
     ·数据集和实验方法第114-116页
     ·实验结果及分析第116-125页
   ·本章小结第125-127页
第六章 结论与展望第127-131页
   ·本文工作总结第127-128页
   ·下一步工作展望第128-131页
致谢第131-133页
参考文献第133-143页
作者在学期间取得的学术成果第143-145页
作者在学期间参与的科研项目第145-147页
附录A INFLUX 平台第147-152页
 平台设计背景第147页
 平台系统结构第147-150页
 平台目前的运转情况第150-152页

论文共152页,点击 下载论文
上一篇:基于多核处理器平台的实时系统WCET分析研究
下一篇:面向建筑物的三维点云生成、增强和重建技术研究