首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题搜索引擎搜索策略的研究及算法设计

中文摘要第3-4页
Abstract第4页
第一章 绪论第8-11页
    1.1 网络搜索引擎的现状及意义第8-9页
    1.2 搜索引擎的国内外动态第9页
    1.3 本文的主要内容和问题第9-11页
第二章 搜索引擎的主流搜索策略及算法第11-27页
    2.1 搜索引擎的分类第11-12页
    2.2 搜索引擎主流技术架构第12-14页
    2.3 搜索引擎的原理结构第14-18页
        2.3.1 网页搜集第14-15页
        2.3.2 预处理第15-17页
        2.3.3 查询服务第17-18页
    2.4 搜索引擎中网络爬虫的搜索策略第18-23页
        2.4.1 宽度优先搜索策略第18-19页
        2.4.2 深度优先搜索策略第19-20页
        2.4.3 基于内容评价的搜索策略第20-21页
        2.4.4 Partial PageRank策略第21-22页
        2.4.5 OCIP策略(Online Page Importance Computation)第22-23页
        2.4.6 大站优先策略(Larger Sites First)第23页
    2.5 网络搜索引擎中的网页更新策略第23-27页
第三章 基于主题爬虫系统设计研究及搜索引擎策略优化第27-39页
    3.1 系统设计研究分析第27-32页
        3.1.1 python爬虫简介第28-29页
        3.1.2 URL解析第29-30页
        3.1.3 正则匹配第30页
        3.1.4 网页下载器第30-31页
        3.1.5 网页解析器第31-32页
    3.2 主题爬虫搜索引擎策略优化第32-39页
        3.2.1 语义分析优化策略第33-35页
        3.2.2 合作资源优化第35-36页
        3.2.3 优质形态优化结果的显示第36-37页
        3.2.4 垂直搜索优化搜索结果第37-39页
第四章 基于Context Graph主题爬行模型的建立第39-55页
    4.1 构建Context Graph模型第40-41页
    4.2 特征选择算法第41-46页
        4.2.1 文档空间向量模型第42-43页
        4.2.2 文档特征选择算法第43-44页
        4.2.3 文档特征权重计算第44-45页
        4.2.4 余弦相似度计算第45-46页
    4.3 分类器的训练及主题分类第46-55页
第五章 实验与结果分析第55-64页
    5.1 系统架构的动态运行流程第55-60页
        5.1.1 URL管理器实现方式第56-57页
        5.1.2 网页下载器实现方式第57-58页
        5.1.3 网页解析器实现方式第58-60页
    5.2 Context Graph主题的目标任务第60-61页
    5.3 实验及结果评测第61-64页
第六章 结论第64-65页
参考 文献第65-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:基于关系数据库关联规则的疾病发展变化趋势研究
下一篇:政府信息领域数字公文本体的构建