首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Na(?)ve Bayes算法的定向爬虫系统设计与实现

摘要第6-8页
ABSTRACT第8-9页
第一章 绪论第10-14页
    1.1 论文研究的背景和意义第10-11页
    1.2 国内外研究现状第11-12页
        1.2.1 国外研究现状第11-12页
        1.2.2 国内研究现状第12页
    1.3 存在的问题第12页
    1.4 本文的工作第12-13页
    1.5 论文的结构第13-14页
第二章 当前网络爬虫技术研究第14-20页
    2.1 网络爬虫概述第14页
    2.2 网络爬虫的基本流程第14-15页
    2.3 当前网络爬虫技术分类第15-18页
        2.3.1 原始网络爬虫第15页
        2.3.2 主题爬虫第15-16页
        2.3.3 定向爬虫第16-17页
        2.3.4 三种爬虫优缺点对比第17-18页
    2.4 正则表达式技术第18页
    2.5 XML路径语言XPath第18-19页
    2.6 本章小结第19-20页
第三章 基于Na(?)ve Bayes分类器的网页去噪方法研究第20-23页
    3.1 Na(?)ve Bayes分类器概述第20-21页
        3.1.1 Bayes算法第20页
        3.1.2 Na(?)ve Bayes算法第20-21页
    3.2 Na(?)ve Bayes分类器工作流程第21-22页
    3.3 Na(?)ve Bayes分类器在本系统中的应用第22页
    3.4 本章小结第22-23页
第四章 系统需求分析第23-26页
    4.1 定向爬虫面临的主要困难第23页
    4.2 系统目标和解决的问题第23-24页
    4.3 系统需求概述第24-25页
        4.3.1 系统的功能性需求分析第24-25页
        4.3.2 系统的非功能性需求分析第25页
    4.4 本章小结第25-26页
第五章 基于Na(?)ve Bayes算法的定向爬虫系统设计第26-35页
    5.1 系统设计目标第26页
    5.2 系统总体设计第26-30页
        5.2.1 技术架构设计第26-27页
        5.2.2 功能架构设计第27-29页
        5.2.3 具体流程设计第29-30页
    5.3 系统详细设计第30-32页
        5.3.1 系统登录模块第30-31页
        5.3.2 目标网址选择模块第31页
        5.3.3 数据采集模块第31页
        5.3.4 数据处理模块第31-32页
    5.4 数据库设计第32-34页
        5.4.1 创建数据库第32页
        5.4.2 数据库表的设计第32-34页
    5.5 本章小结第34-35页
第六章 系统实现与测试第35-44页
    6.1 开发环境第35-36页
    6.2 系统主要模块的实现第36-41页
        6.2.1 二级种子的提取和处理第36-37页
        6.2.2 数据采集模块的实现第37-39页
        6.2.3 数据处理模块的实现第39-40页
        6.2.4 数据存储模块的实现第40-41页
    6.3 基于Naive Bayes算法的定向爬虫系统演示第41-42页
    6.4 系统测试第42-43页
        6.4.1 采集速度第42页
        6.4.2 采集性能第42-43页
    6.5 本章小结第43-44页
第七章 总结与展望第44-45页
    7.1 全文总结第44页
    7.2 不足与展望第44-45页
参考文献第45-47页
致谢第47页

论文共47页,点击 下载论文
上一篇:RA系统的设计与实现
下一篇:国库集中支付系统的设计与实现