首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

分布式电商主题搜索引擎研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-14页
    1.1 研究背景以及意义第10-11页
    1.2 研究现状与发展趋势第11-12页
        1.2.1 搜索引擎历史第11-12页
        1.2.2 发展趋势第12页
    1.3 本文主要研究内容第12-13页
    1.4 本文组织结构第13-14页
第二章 基于HADOOP的搜索引擎相关技术研究第14-34页
    2.1 搜索引擎相关技术研究第14-25页
        2.1.1 网络爬虫第14-16页
        2.1.2 数据索引第16-19页
        2.1.3 中文分词第19-22页
        2.1.4 网页分类第22-24页
        2.1.5 搜索评分第24-25页
    2.2 HADOOP分析与研究第25-33页
        2.2.1 HADOOP框架介绍第25-27页
        2.2.2 MAPREDUCE编程模型第27-30页
        2.2.3 HADOOP分布式文件系统第30-32页
        2.2.4 HADOOP分布式计算结构第32-33页
    2.3 本章小结第33-34页
第三章 HADOOP电商搜索引擎设计与实现第34-52页
    3.1 系统结构总体设计第34-35页
    3.2 分布式爬行子系统第35-39页
        3.2.1 NUTCH工作流程分析第37-38页
        3.2.2 集成朴素贝叶斯分类插件第38-39页
    3.3 电商数据采集限制与解决方案第39-46页
        3.3.1 电商数据采集限制第39-42页
        3.3.2 电商数据采集解决方案第42-46页
    3.4 分布式索引子系统第46-49页
        3.4.1 SOLR工作原理分析第46-48页
        3.4.2 SOLR中文分词配置第48-49页
    3.5 搜索子系统第49-51页
        3.5.1 数据搜索过程分析第49-51页
    3.6 本章小结第51-52页
第四章 系统测试第52-60页
    4.1 测试步骤第52-55页
        4.1.1 设置种子链接第52-53页
        4.1.2 进行网页爬虫第53-54页
        4.1.3 部署SOLR服务第54-55页
    4.2 运行界面第55-59页
    4.3 本章小结第59-60页
第五章 总结与展望第60-62页
    5.1 总结第60页
    5.2 展望第60-62页
参考文献第62-64页
致谢第64-65页
附件第65页

论文共65页,点击 下载论文
上一篇:中小企业融资现状分析及解决方案研究--以A公司在新三板挂牌为例
下一篇:RUNX3表达对食管鳞癌细胞生长的分子机制及临床研究