首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于垂直搜索引擎的主题爬虫算法的研究

摘要第1-5页
ABSTRACT第5-8页
1 绪言第8-12页
   ·研究的背景和意义第8-9页
     ·课题的研究背景第8-9页
     ·研究的目的和意义第9页
   ·国内外研究现状及水平第9-10页
   ·本论文的主要工作和创新第10-11页
   ·本文的结构第11-12页
2 垂直搜索引擎研究综述第12-19页
   ·垂直搜索引擎第12-13页
   ·垂直搜索引擎架构第13-15页
   ·垂直搜索引擎技术第15-18页
   ·本章小结第18-19页
3 主题爬虫简介第19-29页
   ·通用爬虫模型第19-21页
     ·通用爬虫基本原理第19页
     ·通用爬虫体系结构第19-20页
     ·爬行方法与选择策略第20-21页
   ·主题爬虫模型第21-24页
     ·主题爬虫基本原理第21页
     ·主题爬虫体系结构第21-22页
     ·主题爬虫工作流程第22-24页
   ·开源项目的选择第24-28页
     ·Heritrix架构研究第24-26页
     ·Lucene研究第26-28页
   ·本章小结第28-29页
4 基于规则的软主题爬虫算法第29-51页
   ·主题页面在Web上的分布特征第29-30页
   ·隧道技术第30-31页
   ·主题爬虫算法关键点第31-37页
     ·页面主题相关性分析可选方案研究对比第31-34页
     ·Web超链结构重要性分析可选方案研究对比第34-37页
   ·基于规则的软主题爬行方法第37-41页
     ·软主题爬行方法第37-38页
     ·类间链接转移规则爬行方法第38-41页
   ·基于规则的软主题爬虫具体实现第41-50页
     ·类间链接转移规则学习阶段第42页
     ·分类器实现阶段第42-44页
     ·主题爬虫算法具体描述第44-50页
   ·本章小结第50-51页
5 实验测试和性能分析第51-57页
   ·评价指标第51页
   ·页面主题相关性实验第51-53页
   ·收获率对比实验第53-57页
6 总结和未来发展展望第57-59页
参考文献第59-65页
攻读学位期间的主要学术成果第65-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:基于RBF的雕刻曲面建模方法研究
下一篇:关于车牌字符识别技术的研究