首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于蚁群算法的主题爬虫技术研究与实现

摘要第1-6页
Abstract第6-10页
第1章 引言第10-14页
   ·选题背景及研究意义第10-11页
     ·选题背景第10页
     ·选题意义第10-11页
   ·国内外发展现状第11-12页
   ·本论文的主要工作及结构第12-14页
     ·本论文的主要工作第12页
     ·论文结构第12-14页
第2章 搜索引擎基础第14-19页
   ·搜索引擎发展状况第14-16页
     ·搜索引擎的发展历程第14-15页
     ·搜索引擎的分类第15-16页
     ·垂直搜索引擎第16页
   ·垂直搜索引擎原理第16-19页
     ·垂直搜索引擎的体系结构第16-18页
     ·垂直搜索引擎的工作原理第18-19页
第3章 主题爬虫技术理论第19-31页
   ·主题爬虫搜索策略第19-20页
   ·网页质量对主题爬虫的影响第20-24页
     ·网页质量的标准第20-22页
     ·超链接分析技术PageRank 算法第22-24页
   ·主题爬虫技术第24-31页
     ·主题爬虫概念第24页
     ·主题爬虫的理论基础第24页
     ·主题相关度分析第24-26页
     ·主题爬虫的分类模块第26-29页
     ·主题爬虫的流程第29-31页
第4章 蚁群算法指导主题爬虫的相关理论第31-43页
   ·蚁群算法第31-33页
     ·蚁群算法产生的背景第31页
     ·蚁群算法的原理第31-33页
   ·蚁群算法的实现第33-37页
     ·蚁群算法的基本思想第33-34页
     ·蚁群算法的实现(java)第34-37页
   ·服务器日志分析第37-39页
     ·Web 服务器日志第37-38页
     ·日志格式解析第38-39页
   ·Web 服务器日志挖掘第39-41页
     ·Web 日志挖掘第39-40页
     ·Web 日志挖掘中的会话识别第40-41页
   ·蚁群算法在日志挖掘中模型定义第41-43页
第5章 主题爬虫的实现及实验分析第43-56页
   ·观点提出的依据第43-44页
     ·从用户角度分析第43页
     ·从日志挖掘角度分析第43-44页
     ·从蚁群算法本身分析第44页
   ·网络爬虫Heritrix第44-47页
     ·Heritrix 介绍第44-45页
     ·Heritrix 架构设计分析第45-47页
   ·主题爬虫实现第47-53页
     ·选择爬取的网站第47页
     ·在Heritrix 中为爬虫开发抓取所需的定制类第47-53页
   ·蚁群算法指导主题爬虫策略第53-55页
   ·实验结果分析第55-56页
结论第56-58页
 本论文总结第56页
 主题爬虫未来展望第56-58页
致谢第58-59页
参考文献第59-61页
攻读学位期间取得学术成果第61页

论文共61页,点击 下载论文
上一篇:基于RS和GIS的自贡市长山盐矿区生态环境评价
下一篇:基于遥感与GIS的河北省沽源县土地退化监测与风险评价