基于深度学习的Web信息抽取研究与实现

摘要	第4-5页
Abstract	第5页
第1章绪论	第10-13页
1.1 研究背景	第10-11页
1.2 研究目的	第11-12页
1.3 本文贡献	第12-13页
第2章背景技术	第13-24页
2.1 信息抽取相关技术	第13-17页
2.1.1 信息抽取与信息获取的对比	第13-14页
2.1.2 信息抽取主要任务	第14-15页
2.1.3 Web信息抽取	第15-17页
2.2 深度学习相关技术	第17-24页
2.2.1 神经网络与深度学习的发展	第17-18页
2.2.2 循环神经网络	第18-20页
2.2.3 长短时记忆模型-LSTM	第20-21页
2.2.4 TensorFlow深度学习编程系统	第21-24页
第3章基于深度学习的信息抽取模型	第24-39页
3.1 信息抽取模型整体结构	第24-26页
3.2 同网站信息抽取模型	第26-34页
3.2.1 Word Embedding	第28-29页
3.2.2 文本节点RNN	第29-30页
3.2.3 节点序列RNN	第30-33页
3.2.4 Softmax分类	第33-34页
3.3 用于不同网站间Web页面信息抽取的迁移模型	第34-39页
第4章信息抽取模型的算法实现	第39-54页
4.1 获取网页	第39-40页
4.2 网页内容预处理	第40-42页
4.3 标记目标信息	第42-43页
4.4 TensorFlow模型的建立	第43-49页
4.4.1 词库表的建立	第44-45页
4.4.2 Word Embedding	第45页
4.4.3 TensorFlow的构建过程	第45-49页
4.5 启动训练及生成模型	第49-50页
4.6 使用训练模型进行预测	第50-52页
4.7 跨网站页面信息的预测	第52-54页
第5章实验结果分析	第54-68页
5.1 实验结果评测指标	第54-55页
5.1.1 精确率与召回率	第54-55页
5.1.2 综合评价指标F-Mearsure	第55页
5.2 信息抽取结果分析	第55-68页
5.2.1 总体实验结果	第56-58页
5.2.2 训练集页面数量对结果的影响	第58-60页
5.2.3 RNN结构模型对结果的影响	第60-62页
5.2.4 优化算法对结果的影响	第62-65页
5.2.5 跨网站信息抽取结果分析	第65-68页
第6章结语	第68-70页
6.1 工作总结	第68页
6.2 未来展望	第68-70页
参考文献	第70-73页
攻读硕士学位期间主要的研究成果	第73-74页
致谢	第74页