首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

比价购物平台中网络爬虫的设计与实现

摘要第1-6页
Abstract第6-9页
第1章 绪论第9-15页
   ·课题背景第9-10页
   ·研究目的与意义第10-11页
   ·相关研究第11-14页
     ·网络爬虫技术研究方向第11-12页
     ·网络爬虫的国内外研究现状第12-14页
   ·文章结构第14-15页
第2章 搜索引擎概述第15-19页
   ·搜索引擎的历史第15-16页
   ·搜索引擎的分类第16-17页
   ·搜索引擎的工作原理第17-18页
   ·本章小结第18-19页
第3章 网络爬虫概述第19-26页
   ·网络爬虫概述第19页
   ·网络爬虫的程序结构第19-20页
   ·网络爬虫的分类第20-22页
   ·网络爬虫的搜索策略第22-24页
   ·开源网络爬虫介绍第24-25页
   ·本章小结第25-26页
第4章 网页文件抓取技术第26-33页
   ·深入理解URI,URL第26页
   ·HTTP协议第26-29页
   ·URL去重第29-30页
   ·DNS解析第30-31页
   ·Robots.txt第31-32页
   ·本章小结第32-33页
第5章 网页内容分析方法第33-34页
   ·JDK正则表达式分析法第33页
   ·HTMLParser分析法第33页
   ·本章小结第33-34页
第6章 数码产品网络爬虫的系统设计与实现第34-54页
   ·数码产品网络爬虫体系结构第34-35页
   ·定制种子链接第35-37页
   ·网页内容抓取第37-42页
     ·设定抓取范围第37-38页
     ·扩展Frontier类第38-42页
   ·网页内容解析第42-45页
     ·改造Extractor类第42-43页
     ·提取产品属性信息第43-45页
   ·产品信息存储第45-52页
     ·构建产品词库第45-47页
     ·创建产品数据库结构第47-49页
     ·创建数据库第49页
     ·结构化数据第49-50页
     ·新增产品信息方法第50-52页
     ·产品数据存储小结第52页
   ·比价购物平台简要介绍第52-53页
     ·基本功能第52-53页
     ·实现流程第53页
   ·本章小结第53-54页
第7章 实验结果与分析第54-57页
   ·系统的开发环境第54页
   ·系统测试第54-56页
     ·网络抓取网页测试第54-55页
     ·网页内容解析测试第55页
     ·网页数据存储测试第55-56页
     ·用户体验测试第56页
   ·本章小结第56-57页
第8章 总结与展望第57-59页
   ·课题工作总结第57页
   ·工作展望第57-59页
参考文献第59-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:常熟理工学院固定资产管理系统设计与实现
下一篇:电子政务系统安全防护的研究与实践