首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

对话系统数据预处理模块的设计与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7页
1 引言第11-15页
    1.1 研究意义和背景第11-12页
    1.2 研究现状第12-13页
    1.3 本人工作总结第13-14页
    1.4 论文的组织结构第14页
    1.5 本章小结第14-15页
2 系统相关理论和技术综述第15-21页
    2.1 SpringCloud技术第15-17页
    2.2 作业调度框架第17页
    2.3 XPath技术第17-18页
    2.4 正则表达式第18页
    2.5 TiDB第18页
    2.6 Redis第18-19页
    2.7 知识图谱构建技术第19-20页
        2.7.1 本体编辑器第19-20页
        2.7.2 Neo4j第20页
    2.8 本章小结第20-21页
3 需求分析第21-27页
    3.1 系统需求分析第21-25页
        3.1.1 数据采集需求分析第21-24页
        3.1.2 知识图谱构建需求分析第24-25页
    3.2 系统非功能性需求第25-26页
    3.3 需要解决的问题第26页
    3.4 本章小结第26-27页
4 系统设计第27-45页
    4.1 系统总体设计第27-30页
    4.2 数据采集设计第30-37页
        4.2.1 网页下载模块的设计第31-32页
        4.2.2 数据抽取模块的设计第32-33页
        4.2.3 URL调度分发模块的设计第33-34页
        4.2.4 URL过滤模块的设计第34页
        4.2.5 登陆模块的设计第34页
        4.2.6 验证码识别模块的设计第34-35页
        4.2.7 日志模块的设计第35-36页
        4.2.8 系统资源模块的设计第36页
        4.2.9 代理IP模块的设计第36页
        4.2.10 系统管理模块的设计第36-37页
    4.3 知识图谱构建设计第37-40页
        4.3.1 schema模块的设计第37-38页
        4.3.2 数据预处理模块的设计第38页
        4.3.3 数据处理模块的设计第38-40页
        4.3.4 人工编辑模块的设计第40页
    4.4 数据库设计第40-44页
    4.5 本章小结第44-45页
5 系统实现第45-65页
    5.1 数据采集部分第45-60页
        5.1.1 项目结构第45页
        5.1.2 网页下载模块的实现第45-47页
        5.1.3 数据抽取模块的实现第47-48页
        5.1.4 URL过滤模块的实现第48页
        5.1.5 URL调度分发模块的实现第48-50页
        5.1.6 登陆模块的实现第50-51页
        5.1.7 验证码识别模块的实现第51-53页
        5.1.8 日志模块的实现第53页
        5.1.9 系统资源模块的实现第53-55页
        5.1.10 代理IP模块的实现第55页
        5.1.11 系统管理模块的实现第55-60页
    5.2 知识图谱的构建第60-64页
        5.2.1 schema模块的实现第60页
        5.2.2 数据预处理模块的实现第60-61页
        5.2.3 数据处理模块的实现第61-63页
        5.2.4 人工编辑模块的实现第63-64页
    5.3 本章总结第64-65页
6 系统测试第65-75页
    6.1 数据采集功能性测试第65-72页
        6.1.1 下载模块的测试第65-66页
        6.1.2 抽取模块的测试第66页
        6.1.3 URL过滤模块的测试第66-67页
        6.1.4 URL调度分发模块的测试第67页
        6.1.5 登陆模块的测试第67页
        6.1.6 验证码模块的测试第67-68页
        6.1.7 日志模块的测试第68页
        6.1.8 系统资源模块的测试第68-69页
        6.1.9 代理IP模块的测试第69页
        6.1.10 系统管理模块的测试第69-72页
        6.1.11 整体性测试第72页
        6.1.12 运行结果第72页
    6.2 知识图谱构建功能性测试第72-74页
        6.2.1 schema模块的测试第72-73页
        6.2.2 数据预处理模块的测试第73页
        6.2.3 数据处理模块的测试第73-74页
        6.2.4 人工编辑模块的测试第74页
    6.3 本章小结第74-75页
7 总结和展望第75-77页
    7.1 总结第75页
    7.2 展望第75-77页
参考文献第77-79页
作者简历及攻读硕士学位期间取得的研究成果第79-83页
学位论文数据集第83页

论文共83页,点击 下载论文
上一篇:基于微观损伤模型的Q460C钢材断裂行为研究
下一篇:我国快递企业上市动机及模式研究