首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网站聚焦爬虫研究

摘要第1-8页
Abstract第8-9页
1. 绪论第9-16页
   ·引言第9-11页
   ·聚焦爬虫的研究现状及相关工作第11-14页
   ·研究的目的及意义第14页
   ·论文的主要工作和组织结构第14-16页
2. 聚焦爬虫及相关技术第16-33页
   ·通用网络爬虫模型第16-19页
     ·通用网络爬虫结构第16-18页
     ·通用网络爬虫的主要技术问题第18-19页
   ·聚焦爬虫模型第19-23页
     ·聚焦爬虫的原理第19页
     ·聚焦爬虫的结构第19-21页
     ·聚焦爬虫与通用爬虫的区别第21-22页
     ·聚焦爬虫分类第22-23页
   ·相关技术第23-32页
     ·网页处理背景知识第23-26页
     ·超链接分析第26-28页
     ·主题页面的分布特征第28-30页
     ·中文分词技术第30-32页
   ·本章小结第32-33页
3. 面向中文网站的网站聚焦爬虫第33-50页
   ·网络图定义第33-34页
   ·网站聚焦爬虫的任务第34-35页
   ·网站聚焦爬虫体系结构第35页
   ·网站聚焦爬虫的关键技术第35-49页
     ·外部爬行策略第35-39页
     ·内部爬行策略第39页
     ·网页处理模块第39-42页
     ·中文自动分词模块第42-44页
     ·网页分类器模块第44-46页
     ·网站分类器模块第46-49页
   ·本章小结第49-50页
4. 系统运行结果与分析第50-52页
   ·系统运行结果第50页
   ·外部爬行策略改进前后对比第50-52页
5. 总结与展望第52-53页
参考文献第53-56页
附录第56-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:房地产开发贷款的风险及对策研究
下一篇:大连水泥集团市场营销策略研究