首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

可定制的聚焦网络爬虫

摘要第1-7页
Abstract第7-10页
第一章 绪论第10-15页
   ·背景第10-12页
   ·现状第12-13页
   ·本文工作第13-14页
   ·本文结构第14-15页
第二章 网络爬虫原理及分析第15-19页
   ·搜索引擎的原理第15-16页
   ·聚焦网络爬虫第16-17页
   ·可定制的聚焦网络爬虫第17-18页
   ·小结第18-19页
第三章 web页面解析第19-28页
   ·网页获取与链接提取第19-20页
   ·网页特征词提取第20-23页
   ·文本相似度计算第23-24页
   ·网页分类第24-26页
   ·小结第26-28页
第四章 链接的评价技术第28-37页
   ·基于链接结构的评价方法第28-32页
   ·基于网页内容的评价方法第32-33页
   ·锚文本上下文提取第33-36页
   ·小结第36-37页
第五章 CFC分析与设计第37-53页
   ·主题定制策略第37-40页
   ·Ajax页面解析第40-47页
   ·隧道穿越第47-50页
   ·爬行策略第50-51页
   ·小结第51-53页
第六章 CFC实现第53-66页
   ·聚焦爬虫构架第53页
   ·Heritrix第53-58页
   ·JRex第58-59页
   ·系统运行第59-65页
   ·小结第65-66页
第七章 总结与展望第66-68页
   ·本文总结第66-67页
   ·未来展望第67-68页
参考文献第68-71页
攻读学位期间发表论文第71-72页
感谢第72页

论文共72页,点击 下载论文
上一篇:开源工作流引擎Shark的架构分析及改进
下一篇:基于J2ME与规则引擎的无线移动应用系统框架的设计与实现