首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎实现数据信息采集

摘要第4-5页
abstract第5-6页
第一章 引言第9-12页
    1.1 研究背景第9-10页
    1.2 研究和应用现状第10页
    1.3 研究意义第10-11页
    1.4 本文组织机构第11-12页
第二章 搜索引擎相关介绍第12-18页
    2.1 搜索引擎分类第12-14页
        2.1.1 全文搜索引擎第12页
        2.1.2 目录搜索引擎第12页
        2.1.3 元搜索引擎第12-13页
        2.1.4 垂直搜索引擎第13-14页
    2.2 全文搜索引擎原理第14-16页
    2.3 搜索引擎对比第16-17页
        2.3.1 三种常规搜索引擎之间的对比第16页
        2.3.2 全文搜索引擎和垂直搜索引擎的对比第16-17页
    2.4 本章小结第17-18页
第三章 抓取网络信息第18-36页
    3.1 Jsoup工具第19-20页
    3.2 Heritrix爬虫第20-27页
        3.2.1 网页去重第21页
        3.2.2 FishSearch算法第21-22页
        3.2.3 具体实现第22-26页
        3.2.4 简单优化第26-27页
    3.3 API抓取第27-33页
    3.4 三种抓取方式的比较第33-35页
        3.4.1 常规爬虫的比较第33-34页
        3.4.2 常规爬虫和新型抓取工具的比较第34-35页
    3.5 本章小结第35-36页
第四章 Lucene索引和检索第36-53页
    4.1 Lucene简介第36-38页
        4.1.1 Lucene的核心类第37页
        4.1.2 索引和索引库第37-38页
    4.2 索引创建第38-39页
    4.3 分词器比较第39-40页
    4.4 IK分词器第40-47页
        4.4.1 词典第40-41页
        4.4.2 分词第41-42页
        4.4.3 词元比较算法第42页
        4.4.4 歧义判断第42-43页
        4.4.5 优化改进第43-47页
    4.5 Lucene评分机制第47-51页
    4.6 索引查询第51页
    4.7 本章小结第51-53页
第五章 仿真实现搜索引擎功能第53-58页
    5.1 开发环境和工具第53页
    5.2 具体设计第53-54页
        5.2.1 原文件数据搜集第53-54页
        5.2.2 为原文件创建索引第54页
        5.2.3 查询索引第54页
    5.3 结果显示第54-57页
    5.4 本章小结第57-58页
第六章 展望和总结第58-60页
    6.1 论文的研究成果第58-59页
    6.2 论文的不足第59页
    6.3 展望规划第59-60页
致谢第60-61页
参考文献第61-63页
作者简介第63页
攻读硕士学位期间研究成果第63页

论文共63页,点击 下载论文
上一篇:基于振动能量收集的无线传感器节点自发电系统研究及应用
下一篇:基于支持向量机的Landsat8影像分类应用研究