首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Jsoup的通用网页采集系统的设计与实现

摘要第5-6页
ABSTRACT第6页
第一章 引言第9-16页
    1.1 研究背景第9-10页
    1.2 国内外现状第10-14页
        1.2.1 基于文档结构树分析的网页正文提取技术第10-12页
        1.2.2 不基于文档结构树分析的网页正文提取技术第12-14页
    1.3 主要工作内容第14-15页
    1.4 论文组织结构第15页
    1.5 本章小结第15-16页
第二章 系统需求分析与方案设计第16-26页
    2.1 研究背景第16页
    2.2 系统的需求分析第16-20页
        2.2.1 网页正文内容提取的需求第18-19页
        2.2.2 参数可配置的需求第19页
        2.2.3 操作历史可监控的需求第19页
        2.2.4 文本分词与停止词分析的需求第19-20页
    2.3 系统的方案设计第20-25页
        2.3.1 系统的网络拓扑图第20-21页
        2.3.2 系统的软件功能框架第21页
        2.3.3 技术选型第21-25页
    2.4 本章小结第25-26页
第三章 系统的软件设计第26-39页
    3.1 数据库设计第26-27页
        3.1.1 数据逻辑视图第26-27页
        3.1.2 数据物理视图第27页
    3.2 WEB应用设计第27-29页
        3.2.1 WEB架构设计原则第27-28页
        3.2.2 WEB架构图第28-29页
    3.3 系统核心模块设计第29-38页
        3.3.1 核心模块体系结构第30-33页
        3.3.2 核心模块划分第33-38页
    3.4 本章小结第38-39页
第四章 系统的软件实现第39-57页
    4.1 数据库的实现第39-41页
    4.2 WEB前端的实现第41-48页
        4.2.1 正文提取页面第44-45页
        4.2.2 分词页面第45-46页
        4.2.3 停止词计算页面第46页
        4.2.4 系统参数设置页面第46-47页
        4.2.5 操作历史页面第47-48页
    4.3 核心算法模块的实现第48-55页
        4.3.1 文档格式化处理模块的实现第48-49页
        4.3.2 文档裁剪降噪模块的实现第49-51页
        4.3.3 文档正文节点判断功能模块的实现第51-54页
        4.3.4 文档正文格式化输出功能模块的实现第54-55页
    4.4 本章小结第55-57页
第五章 测试与分析第57-67页
    5.1 软件的代码级测试第57-60页
    5.2 软件的功能级测试第60-64页
    5.3 软件的性能级测试第64-66页
    5.4 本章小结第66-67页
第六章 总结与展望第67-69页
    6.1 全文总结第67-68页
    6.2 后续工作展望第68-69页
致谢第69-70页
参考文献第70-72页

论文共72页,点击 下载论文
上一篇:脂肪酶催化Knoevenagel缩合反应及其在多组分串联反应中的应用
下一篇:南极假丝酵母脂肪酶B催化多功能性及其机制的研究