首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎的研究分析与实现

中文摘要第4-5页
Abstract第5页
第1章 绪论第8-13页
    1.1 搜索引擎的研究背景第8页
    1.2 论文主要研究内容第8页
    1.3 论文结构第8-9页
    1.4 搜索引擎的概念第9-10页
    1.5 搜索引擎的发展历史第10-13页
第2章 现有搜索引擎的研究第13-17页
    2.1 引擎分类第13-14页
        2.1.1 全文搜索引擎第13页
        2.1.2 垂直搜索引擎第13页
        2.1.3 元搜索引擎第13-14页
        2.1.4 目录索引类搜索引擎第14页
        2.1.5 其他搜索引擎第14页
    2.2 几款现在流行的搜索引擎第14-17页
        2.2.1 百度搜索引擎第14-15页
        2.2.2 谷歌搜索引擎第15-17页
第3章 搜索引擎的剖析第17-31页
    3.1 引擎的工作流程第17页
    3.2 网络爬虫第17-23页
        3.2.1 爬虫的结构第18页
        3.2.2 爬虫的工作原理第18-19页
        3.2.3 爬虫抓取网页的结构第19页
        3.2.4 爬虫的抓取策略第19-23页
        3.2.5 网页的分析算法第23页
    3.3 索引第23-27页
        3.3.1 全文检索第24页
        3.3.2 文本信息索引技术第24-26页
        3.3.3 信息库第26-27页
    3.4 排序算法第27-31页
        3.4.1 第一代搜索引擎排序法——词频统计、词位置加权法第27页
        3.4.2 第二代搜索引擎排序法——链接分析排序法第27-29页
        3.4.3 第三代搜索引擎排序法——基于智能化排序法第29-31页
第4章 开源架构研究第31-43页
    4.1 Struts架构第31-32页
    4.2 Hibernate架构第32-34页
    4.3 Spring架构第34-35页
    4.4 Compass架构第35-36页
    4.5 搜索引擎核心架构——Lucene第36-43页
        4.5.1 全文检索框架的实现机制第36-37页
        4.5.2 Lucene的倒排算法第37-39页
        4.5.3 Lucene的结构框架第39-40页
        4.5.4 Lucene的创新之处第40页
        4.5.5 中文切词问题研究第40-43页
第5章 搜索引擎的设计第43-55页
    5.1 代码架构构成第43-44页
    5.2 数据结构第44-46页
    5.3 详细设计第46-52页
        5.3.1 核心流程详细说明第46-48页
        5.3.2 编码设计第48-52页
    5.4 运行结果第52-55页
第6章 总结与展望第55-56页
参考文献第56-58页
攻读学位期间公开发表的论文第58-59页
致谢第59-60页

论文共60页,点击 下载论文
上一篇:基于Docker的持续集成系统的设计与实现
下一篇:基于二维码的生产追溯系统的设计与实现