首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题爬虫系统的研究

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-13页
   ·论文的研究背景第8-9页
   ·主题爬虫的研究现状第9-10页
   ·论文的研究意义第10-11页
   ·论文的相关工作第11-12页
   ·论文的安排第12-13页
第2章 主题爬虫技术第13-20页
   ·搜索引擎技术第13-14页
   ·通用网络爬虫第14-16页
   ·主题爬虫第16-19页
     ·主题爬虫与通用爬虫的区别第16-17页
     ·主题爬虫的工作原理第17-18页
     ·主题爬虫的结构第18-19页
   ·本章小结第19-20页
第3章 主题爬虫系统CarSpider的设计第20-34页
   ·CarSpider总体设计第20-21页
   ·主题描述第21-23页
   ·种子链接的选择第23-24页
   ·网页预处理第24-30页
     ·中文分词第24-26页
     ·HTML文件简介第26页
     ·网页文件解析第26-30页
   ·主题相关度判定第30页
   ·网页消重第30-33页
     ·URL消重第30-32页
     ·内容消重第32-33页
   ·本章小结第33-34页
第4章 汽车主题相关度判定第34-51页
   ·主题网页类型分析第34-35页
     ·网页块类型判定第34页
     ·网页类型判定第34-35页
   ·网页主题信息抽取第35-42页
     ·主题相关性算法研究第36-39页
     ·网页量化表示第39-41页
     ·网页主题信息抽取第41-42页
   ·URL与主题相关性预测第42-50页
     ·基于网页内容的URL主题相关度预测第43-46页
     ·基于网络结构的URL主题相关度预测第46-48页
     ·自适应主题爬行策略第48-50页
   ·本章小结第50-51页
第5章 主题爬虫系统CarSpider的实现第51-58页
   ·主题爬虫的实现第51-55页
     ·相关类实现第51-53页
     ·实验环境第53页
     ·系统运行第53-55页
   ·实验研究第55-57页
   ·本章小结第57-58页
第6章 总结与展望第58-60页
   ·本文总结第58-59页
   ·下一步工作第59-60页
致谢第60-61页
参考文献第61-64页
攻读学位期间发表论文第64页

论文共64页,点击 下载论文
上一篇:基于工作流的权限控制系统
下一篇:复杂曲面数字化在线检测系统的关键技术研究