首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于深度学习的Web信息抽取研究与实现

摘要第4-5页
Abstract第5页
第1章 绪论第10-13页
    1.1 研究背景第10-11页
    1.2 研究目的第11-12页
    1.3 本文贡献第12-13页
第2章 背景技术第13-24页
    2.1 信息抽取相关技术第13-17页
        2.1.1 信息抽取与信息获取的对比第13-14页
        2.1.2 信息抽取主要任务第14-15页
        2.1.3 Web信息抽取第15-17页
    2.2 深度学习相关技术第17-24页
        2.2.1 神经网络与深度学习的发展第17-18页
        2.2.2 循环神经网络第18-20页
        2.2.3 长短时记忆模型-LSTM第20-21页
        2.2.4 TensorFlow深度学习编程系统第21-24页
第3章 基于深度学习的信息抽取模型第24-39页
    3.1 信息抽取模型整体结构第24-26页
    3.2 同网站信息抽取模型第26-34页
        3.2.1 Word Embedding第28-29页
        3.2.2 文本节点RNN第29-30页
        3.2.3 节点序列RNN第30-33页
        3.2.4 Softmax分类第33-34页
    3.3 用于不同网站间Web页面信息抽取的迁移模型第34-39页
第4章 信息抽取模型的算法实现第39-54页
    4.1 获取网页第39-40页
    4.2 网页内容预处理第40-42页
    4.3 标记目标信息第42-43页
    4.4 TensorFlow模型的建立第43-49页
        4.4.1 词库表的建立第44-45页
        4.4.2 Word Embedding第45页
        4.4.3 TensorFlow的构建过程第45-49页
    4.5 启动训练及生成模型第49-50页
    4.6 使用训练模型进行预测第50-52页
    4.7 跨网站页面信息的预测第52-54页
第5章 实验结果分析第54-68页
    5.1 实验结果评测指标第54-55页
        5.1.1 精确率与召回率第54-55页
        5.1.2 综合评价指标F-Mearsure第55页
    5.2 信息抽取结果分析第55-68页
        5.2.1 总体实验结果第56-58页
        5.2.2 训练集页面数量对结果的影响第58-60页
        5.2.3 RNN结构模型对结果的影响第60-62页
        5.2.4 优化算法对结果的影响第62-65页
        5.2.5 跨网站信息抽取结果分析第65-68页
第6章 结语第68-70页
    6.1 工作总结第68页
    6.2 未来展望第68-70页
参考文献第70-73页
攻读硕士学位期间主要的研究成果第73-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:基于代数规约的Web服务自动化测试技术研究
下一篇:基于编码路径保护的P2P网络视频监控系统研究与实现