首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

专业信息定向采集与多维搜索系统

摘要第4-5页
Abstract第5页
第1章 绪论第12-16页
    1.1 课题背景第12-13页
    1.2 本文主要工作第13-14页
    1.3 本文组织结构第14-15页
    1.4 本章小结第15-16页
第2章 相关工作综述第16-27页
    2.1 互联网数据采集第16-20页
        2.1.1 Scrapy框架第17-18页
        2.1.2 URL过滤第18-19页
        2.1.3 正文抽取第19-20页
    2.2 数据存储与索引第20-22页
        2.2.1 MongoDB第20-21页
        2.2.2 ElasticSearch第21-22页
    2.3 分布式服务平台第22-23页
        2.3.1 消息中间件Kafka第22页
        2.3.2 分布式协调ZooKeeper第22-23页
        2.3.3 流式计算Storm第23页
    2.4 全文检索与多维导航第23-26页
    2.5 本章小节第26-27页
第3章 系统总体设计第27-34页
    3.1 系统设计目标第27页
    3.2 系统需求分析第27-30页
        3.2.1 数据采集需求分析第27-29页
        3.2.2 多维搜索需求分析第29-30页
    3.3 系统总体设计与架构第30-33页
        3.3.1 数据采集子系统架构第31-32页
        3.3.2 多维搜索子系统架构第32-33页
    3.4 本章小结第33-34页
第4章 基于任务调度优化的分布式定向爬虫第34-48页
    4.1 Chrome Plugin第34-36页
    4.2 Scheduler调度器第36-40页
        4.2.1 任务调度策略第36-37页
        4.2.2 全局限流策略第37-39页
        4.2.3 抓取策略第39-40页
    4.3 Crawler采集器第40-44页
        4.3.1 URLs预取策略第40-42页
        4.3.2 自定义HTTP请求第42-44页
    4.4 Parser解析器第44-47页
        4.4.1 任务配置协议第44-46页
        4.4.2 维护任务配置策略第46-47页
    4.5 本章小结第47-48页
第5章 可视化多维搜索服务系统第48-61页
    5.1 数据清洗第48-52页
        5.1.1 文档去噪第48-51页
        5.1.2 文档去重第51-52页
    5.2 领域信息抽取第52-54页
        5.2.1 中文分词第52-53页
        5.2.2 领域实体抽取第53-54页
    5.3 多维搜索服务第54-60页
        5.3.1 专业领域概念体系第54-56页
        5.3.2 跨主题跨源搜索第56-57页
        5.3.3 维度聚合查询第57-58页
        5.3.4 可视化搜索第58-60页
    5.4 本章小结第60-61页
第6章 系统实现与应用第61-70页
    6.1 分布式爬虫服务第61-62页
    6.2 多维搜索服务第62-63页
    6.3 系统扩展性与性能评测第63-66页
        6.3.1 系统扩展性分析第63-64页
        6.3.2 系统相关测试第64-66页
    6.4 系统应用第66-69页
        6.4.1 分布式爬虫服务应用第66-67页
        6.4.2 多维搜索服务系统应用第67-69页
    6.5 本章小结第69-70页
第7章 总结与展望第70-72页
    7.1 全文总结第70-71页
    7.2 未来展望第71-72页
参考文献第72-75页
攻读硕士学位期间主要的研究成果第75-76页
致谢第76-77页

论文共77页,点击 下载论文
上一篇:一种小型FDM三维打印机控制系统研究与实现
下一篇:应用TALENs以及CRISPR/Cas9技术构建B细胞缺失免疫缺陷猪模型