首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

云环境下搜索引擎系统关键技术研究

摘要第4-5页
Abstract第5页
专用术语注释表第8-9页
第一章 绪论第9-14页
    1.1 研究背景与意义第9-10页
    1.2 国内外研究现状第10-12页
    1.3 主要工作与章节安排第12-14页
第二章 搜索引擎关键技术分析第14-26页
    2.1 搜索引擎系统基本原理第14-18页
        2.1.1 数据采集子系统第14-17页
        2.1.2 索引子系统第17-18页
        2.1.3 查询子系统第18页
    2.2 云环境下搜索引擎系统第18-23页
        2.2.1 云环境下搜索引擎系统特点第18-19页
        2.2.2 开源搜索引擎系统Nutch第19-23页
    2.3 云环境下搜索引擎关键技术第23-25页
        2.3.1 分词技术第23页
        2.3.2 文本去重技术第23-24页
        2.3.3 全文索引技术第24页
        2.3.4 数据采集技术第24页
        2.3.5 数据存储技术第24-25页
    2.4 本章小结第25-26页
第三章 一种基于LCS的文本快速去重算法第26-37页
    3.1 相关研究与问题描述第26-29页
    3.2 一种基于LCS的文本去重算法第29-32页
        3.2.1 LCS算法第29页
        3.2.2 基于LCS的文本去重算法(SWLR)第29-30页
        3.2.3 快速SWLR文本去重算法第30-32页
    3.3 性能仿真及结果分析第32-36页
        3.3.1 实验环境第32页
        3.3.2 SWLR文本去重算法第32-34页
        3.3.3 快速SWLR文本去重算法第34-36页
    3.4 本章小结第36-37页
第四章 一种基于链表结构的全文索引模型第37-53页
    4.1 相关研究与问题描述第37-45页
        4.1.1 倒排索引模型第37-40页
        4.1.2 后缀树索引模型第40-42页
        4.1.3 后缀数组索引模型第42-45页
    4.2 基于链表结构改进的倒排索引模型第45-49页
        4.2.1 改进的倒排索引模型结构设计第46-47页
        4.2.2 改进的倒排索引模型构造算法第47-48页
        4.2.3 改进的倒排索引模型查询算法第48-49页
    4.3 性能仿真及结果分析第49-52页
        4.3.1 实验环境第49页
        4.3.2 索引构建时间对比第49-50页
        4.3.3 查询时间对比第50-51页
        4.3.4 内存空间使用对比第51-52页
    4.4 本章小结第52-53页
第五章 一种基于云环境的并行网络爬虫系统第53-65页
    5.1 相关研究与需求分析第53-56页
        5.1.1 基于Hadoop的开源网络爬虫Nutch第53-55页
        5.1.2 云环境下网络爬虫需求分析第55-56页
    5.2 基于云环境的网络爬虫系统设计第56-61页
        5.2.1 总体结构设计第56-57页
        5.2.2 数据模型设计第57-58页
        5.2.3 功能模块实现第58-61页
    5.3 性能仿真及结果分析第61-64页
        5.3.1 单机版本实验分析第61-62页
        5.3.2 分布式版本实验分析第62-64页
    5.4 本章小结第64-65页
第六章 总结与展望第65-67页
参考文献第67-70页
附录1 攻读硕士学位期间撰写的论文第70-71页
附录2 攻读硕士学位期间申请的专利第71-72页
附录3 攻读硕士学位期间参加的科研项目第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:明代朝廷对永顺土司嘉奖研究
下一篇:清朝中期湘西“苗疆禁例”研究