首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

分布式网络爬虫在农产品搜索系统中的应用与研究

摘要第3-5页
ABSTRACT第5-6页
第1章 绪论第9-13页
    1.1 研究背景及意义第9-10页
    1.2 国内外研究现状第10-11页
    1.3 本文研究内容第11-12页
    1.4 论文组织结构第12-13页
第2章 相关技术第13-28页
    2.1 Hadoop平台介绍第13-16页
        2.1.1 MapReduce编程模型第13-15页
        2.1.2 HDFS第15-16页
    2.2 分布式网络爬虫技术第16-19页
        2.2.1 网络爬虫模型简介第16-18页
        2.2.2 分布式的网络爬虫第18-19页
    2.3 面向商品信息的垂直搜索引擎第19-21页
    2.4 Nutch架构第21-28页
        2.4.1 爬行策略和排序算法第22-24页
        2.4.2 功能组成第24-28页
第3章 农产品信息采集模块研究与设计第28-38页
    3.1 需求与设计目标第28-29页
    3.2 分布式农产品信息采集结构设计第29-32页
        3.2.1 分布式爬虫架构第30页
        3.2.2 基于Hadoop的分布式第30-31页
        3.2.3 分布式任务的协调第31-32页
    3.3 聚焦农产品信息第32-38页
        3.3.1 基于Nutch的URL确定和过滤第32-34页
        3.3.2 主题相关性判断第34-36页
        3.3.3 信息抽取第36-38页
第4章 索引和搜索模块研究与设计第38-44页
    4.1 需求和设计目标第38页
    4.2 中文分词和文本分析第38-40页
    4.3 索引模块第40-41页
    4.4 搜索模块第41-44页
第5章 分布式农产品搜索系统测试分析第44-49页
第6章 总结与展望第49-51页
    6.1 总结第49页
    6.2 工作不足和展望第49-51页
致谢第51-52页
参考文献第52-54页

论文共54页,点击 下载论文
上一篇:琅琊镇配网工程项目风险管理研究
下一篇:A供电公司内部控制体系优化及应用研究