首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Map-Reduce 和Trie树的搜索需求识别研究

摘要第3-4页
Abstract第4-5页
第1章 绪论第8-13页
    1.1 课题背景与研究意义第8-9页
    1.2 国内外研究现状第9-11页
        1.2.1 搜索需求识别研究现状第9-10页
        1.2.2 分布式系统国内外研究现状第10-11页
    1.3 本文的研究思路第11-12页
    1.4 本文的组织结构第12-13页
第2章 搜索需求识别与Map-Reduce相关理论第13-27页
    2.1 搜索需求识别基本理论第13-17页
        2.1.1 搜索引擎服务的一般过程第13-14页
        2.1.2 用户搜索需求分类第14-16页
        2.1.3 用户搜索需求识别的应用第16-17页
    2.2 Map-Reduce编程框架基本理论第17-24页
        2.2.1 分布式文件系统第17-19页
        2.2.2 Map-Reduce过程简介第19-20页
        2.2.3 Map-Reduce的执行细节第20页
        2.2.4 Hadoop并行计算平台第20-22页
        2.2.5 Hadoop中的Map-Reduce特性第22-24页
    2.3 搜索模板概述第24-25页
        2.3.1 自然语言中的模板第24-25页
        2.3.2 搜索引擎中的模板第25页
    2.4 本章小结第25-27页
第3章 构建需求识别模板的Paratemp策略第27-37页
    3.1 搜索模板相关定义第27-28页
    3.2 Paratemp策略的思想第28-29页
    3.3 Paratemp中的Map-Reduce模板提取第29-30页
    3.4 基于关联规则启发的搜索模板评价第30-34页
        3.4.1 将频数作为模板筛选标准的局限性第30页
        3.4.2 Paratemp中的搜索频度与辨识度标准第30-32页
        3.4.3 Paratemp中的搜索模板剪枝第32-34页
    3.5 基于Paratemp剪枝的评价指标计算第34-35页
        3.5.1 基于Map-Reduce的搜索频度计算第34页
        3.5.2 基于Map-Reduce的辨识度计算第34-35页
    3.6 模板词的提取第35页
    3.7 模板的冲突处理第35-36页
    3.8 本章小结第36-37页
第4章 Tempaser搜索需求识别算法第37-46页
    4.1 Tempaser识别算法介绍第37-39页
        4.1.1 Tempaser算法的设计目标第37-38页
        4.1.2 Tempaser算法的设计第38-39页
    4.2 Tempaser算法的主要瓶颈第39页
    4.3 Tempaser算法中的前缀词匹配第39-40页
    4.4 Tempaser算法描述第40-44页
        4.4.1 Hash表的建立与维护第40-42页
        4.4.2 Trie树的的建立,节点的增删第42-43页
        4.4.3 Trie树的解析匹配过程第43-44页
    4.5 Tempaser算法的时间复杂度第44-45页
    4.6 本章小结第45-46页
第5章 实验与评价第46-52页
    5.1 硬件与软件环境第46页
    5.2 实验方案设计第46-47页
    5.3 实验步骤第47-50页
        5.3.1 数据预处理第47-48页
        5.3.2 Map-Reduce过程第48页
        5.3.3 模板和模板词的提取第48-50页
    5.4 实验结果及其评价第50-51页
        5.4.1 验证实验结果第50-51页
    5.5 本章小结第51-52页
第6章 总结与展望第52-54页
    6.1 研究总结第52页
    6.2 对未来的展望第52-54页
参考文献第54-57页
致谢第57-58页
在读期间公开发表论文(著)及科研情况第58页

论文共58页,点击 下载论文
上一篇:IP21实时数据库在石化企业的研究与应用
下一篇:可伸缩分布式文件系统及其应用