首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于增量学习的主题爬行策略研究

摘要第1-5页
Abstract第5-9页
1 绪论第9-13页
   ·课题研究的背景和意义第9-10页
   ·主题搜索的研究现状第10-12页
   ·本文的主要研究内容第12-13页
2 主题爬虫相关知识第13-19页
   ·主题爬虫工作原理第13页
   ·主题爬行策略第13-15页
     ·基于内容的主题爬虫第13-14页
     ·基于分类的主题爬虫第14页
     ·基于链接的主题爬虫第14-15页
   ·主题意图提取第15页
   ·相关性计算第15-17页
     ·基于URL 的相关度计算第15-16页
     ·基于内容的相似度计算第16-17页
   ·Web 网页变化第17-19页
3 形式概念分析及其在主题搜索中的应用第19-27页
   ·形式概念分析第19-22页
     ·形式概念分析现状第19页
     ·形式概念分析理论基础第19-21页
     ·概念格的构建第21-22页
   ·概念格在主题搜索中的应用第22-24页
   ·概念背景图第24-27页
     ·核心概念第24页
     ·基于概念相似度的背景图第24-25页
     ·基于分层和相似度的概念背景图第25-27页
4 基于增量学习的主题爬行策略第27-43页
   ·增量学习思想来源第27-28页
   ·增加主题相关概念第28-36页
     ·主题相关网页第29页
     ·增量概念及其生产算法第29-33页
     ·更新概念背景图第33-36页
   ·删除主题不相关概念第36-41页
   ·爬行系统架构第41-43页
5 实验第43-56页
   ·系统构建第43页
   ·试验过程第43-52页
     ·数据集第43-47页
     ·选取初始URLs第47-48页
     ·生成概念格第48页
     ·得到概念背景图第48-49页
     ·利用原始背景图爬行预测结果第49-51页
     ·增加主题相关网页后爬行预测结果第51页
     ·删除主题不相关网页后爬行预测结果第51-52页
   ·结果分析第52-56页
     ·评价指标第52页
     ·对比策略第52页
     ·结果分析第52-56页
6 结论第56-58页
   ·总结第56页
   ·展望第56-58页
参考文献第58-62页
攻读硕士学位期间学术论文及科研情况第62-63页
致谢第63-64页

论文共64页,点击 下载论文
上一篇:ERP中全面质量管理系统的研究与开发
下一篇:面向个性化主题搜索的用户—查询词语义本体构建