首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于主题的多线程网络爬虫系统的研究与实现

摘要第4-5页
ABSTRACT第5-6页
目录第7-10页
第一章 绪论第10-14页
    1.1 研究背景第10-11页
    1.2 国内外研究现状第11-12页
    1.3 本文主要研究工作第12页
    1.4 论文组织结构第12-14页
第二章 爬虫基本原理及相关技术第14-20页
    2.1 爬虫技术第14页
    2.2 通用爬虫第14-17页
        2.2.1 通用爬虫的基本工作流程第14-15页
        2.2.2 通用爬虫爬行策略第15-16页
        2.2.3 通用爬虫的不足第16-17页
    2.3 主题爬虫第17-19页
        2.3.1 主题爬虫的结构第17页
        2.3.2 主题爬虫的搜索策略第17-19页
    2.4 Crawler4J介绍第19页
    2.5 本章小结第19-20页
第三章 系统关键算法研究第20-34页
    3.1 相关背景第20-21页
    3.2 基于语义指纹与LCS的文本去重方法第21-22页
    3.3 去重模型第22页
    3.4 特征向量生成第22-25页
        3.4.1 生成内容特征向量第22-24页
        3.4.2 生成摘要特征向量第24-25页
    3.5 语义指纹生成第25-26页
    3.6 相似度计算第26-29页
        3.6.1 指纹相似度计算方法第26-27页
        3.6.2 内容相似度计算方法第27-29页
    3.7 去重方法实现流程第29-30页
    3.8 实验验证第30-33页
    3.9 本章小结第33-34页
第四章 系统需求分析与总体功能的设计第34-55页
    4.1 系统需求分析与系统目标第34-36页
        4.1.1 功能性需求第34-35页
        4.1.2 非功能性需求第35-36页
        4.1.3 系统目标第36页
    4.2 网络架构设计第36-37页
    4.3 系统层次结构设计第37-38页
    4.4 系统功能架构第38-40页
    4.5 系统流程设计第40-42页
    4.6 数据库设计第42-51页
        4.6.1 概念模型设计第42-43页
        4.6.2 数据库逻辑结构设计第43-45页
        4.6.3 物理表的设计第45-51页
    4.7 主要接口设计第51-53页
    4.8 界面总体设计第53-54页
        4.8.1 界面设计原则第53页
        4.8.2 界面设计第53-54页
    4.9 本章小结第54-55页
第五章 系统主要功能模块的设计与实现第55-77页
    5.1 多线程爬虫模块第55-61页
        5.1.1 功能设计第55-58页
        5.1.2 流程设计第58-60页
        5.1.3 页面更新检测第60页
        5.1.4 关键代码第60-61页
    5.2 主题判定模块第61-64页
        5.2.1 功能设计第61-62页
        5.2.2 流程设计第62页
        5.2.3 算法设计第62-63页
        5.2.4 关键代码第63-64页
    5.3 文本去重模块第64-69页
        5.3.1 功能设计第64页
        5.3.2 流程设计第64-65页
        5.3.3 算法设计第65页
        5.3.4 关键代码第65-69页
    5.4 信息检索模块第69-72页
        5.4.1 功能设计第69页
        5.4.2 构建全文索引第69-70页
        5.4.3 信息检索实现流程第70-71页
        5.4.4 关键代码第71-72页
    5.5 系统界面设计与展示第72-76页
        5.5.1 界面整体结构设计第72页
        5.5.2 界面展示第72-76页
    5.6 本章小结第76-77页
第六章 实验及结果分析第77-85页
    6.1 实验环境第77页
    6.2 系统功能测试第77-81页
    6.3 系统性能测试第81-84页
        6.3.1 测试性能指标第82页
        6.3.2 实验结果及评估第82-84页
    6.4 本章小结第84-85页
第七章 总结与展望第85-87页
    7.1 论文工作总结第85-86页
    7.2 问题和展望第86-87页
参考文献第87-89页
致谢第89-90页
攻读学位期间发表的学术论文第90页

论文共90页,点击 下载论文
上一篇:虚拟场景三维显示实现平台研究
下一篇:基于蓝牙4.0低功耗室内定位研究