首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于遗传算法的主题网络爬虫搜索策略研究与设计

摘要第4-5页
ABSTRACT第5-6页
缩写第9-10页
第一章 绪论第10-16页
    1.1 研究背景和意义第10-11页
    1.2 搜索引擎概述第11-14页
        1.2.1 搜索引擎概念第11页
        1.2.2 搜索引擎基本结构第11-12页
        1.2.3 搜索引擎分类第12-13页
        1.2.4 通用搜索引擎的不足第13-14页
        1.2.5 垂直搜索引擎第14页
    1.3 研究内容与组织结构第14-16页
第二章 网络爬虫基础第16-25页
    2.1 网络爬虫概念第16页
    2.2 网络爬虫研究现状第16-17页
    2.3 通用网络爬虫第17-20页
        2.3.1 通用网络爬虫概念第17-18页
        2.3.2 通用网络爬虫工作流程第18-19页
        2.3.3 通用网络爬虫结构第19-20页
    2.4 主题网络爬虫第20-24页
        2.4.1 主题网络爬虫概念第20-21页
        2.4.2 主题网络爬虫工作流程第21-22页
        2.4.3 主题网络爬虫结构第22页
        2.4.4 主题网络爬虫的问题和目标第22-24页
    2.5 本章小结第24-25页
第三章 基于遗传算法的搜索策略第25-36页
    3.1 主题搜索策略第25-29页
        3.1.1 基于内容评价的搜索策略第25-27页
        3.1.2 基于链接关系的搜索策略第27-29页
    3.2 遗传算法第29-30页
    3.3 基于遗传算法的主题搜索策略第30-32页
    3.4 遗传算子设计第32-35页
        3.4.1 适应度函数第33页
        3.4.2 选择操作第33-34页
        3.4.3 交叉操作第34页
        3.4.4 变异操作第34页
        3.4.5 迭代终止条件第34-35页
    3.5 本章小结第35-36页
第四章 主题网络爬虫的设计第36-48页
    4.1 主题网络爬虫基本问题第36-39页
        4.1.1 主题描述第36-37页
        4.1.2 网页主题相关度计算第37-38页
        4.1.3 链接价值计算第38-39页
    4.2 主题网络爬虫详细设计第39-46页
        4.2.1 主要数据结构第40-41页
        4.2.2 页面下载模块第41-42页
        4.2.3 HTML解析模块第42-43页
        4.2.4 页面分析模块第43-45页
        4.2.5 遗传算法种群生成模块第45-46页
    4.3 本章小结第46-48页
第五章 主题网络爬虫的应用实现第48-54页
    5.1 Security Data Collector系统第48-49页
    5.2 主题网络爬虫模块实现及对比分析第49-52页
        5.2.1 主题网络爬虫模块实现第49-50页
        5.2.2 性能指标第50-51页
        5.2.3 结果分析第51-52页
    5.3 本章小结第52-54页
第六章 总结与展望第54-56页
参考文献第56-59页
致谢第59-60页
攻读学位期间发表或已录用的学术论文第60页

论文共60页,点击 下载论文
上一篇:近水面环境2.4GHz信号传播特性的理论研究
下一篇:基于网络编码的WSN轻量级安全研究