基于神经网络的Web信息抽取系统的研究与实现

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-13页
·研究背景	第9-10页
·信息抽取（Information Extraction: IE）	第9-10页
·Web 信息抽取（Web information extraction）	第10页
·研究现状	第10-11页
·本文研究内容	第11-12页
·论文结构安排	第12-13页
第二章 WEB 信息抽取概述	第13-26页
·IE 的发展历史与现状	第13-15页
·IE 的任务	第15-16页
·WEB 信息抽取技术分类	第16-21页
·基于HTML 结构的方式	第17页
·基于自然语言处理的方式	第17-19页
·包装器归纳（Wrapper Induction）方式	第19-20页
·基于Ontology 的方式	第20-21页
·半结构化数据及XML 技术的应用	第21-22页
·WEB 信息抽取与机器学习	第22-24页
·抽取规则的生成	第22-23页
·机器学习方法	第23-24页
·评价指标	第24-25页
·小结	第25-26页
第三章 WEB 信息抽取系统框架结构	第26-36页
·系统目标和分析	第26-29页
·系统目标	第26页
·系统分析	第26-28页
·XML 在系统中的作用	第28-29页
·系统框架和整体流程	第29-32页
·系统知识库	第32-35页
·目标语义模式库	第32-33页
·抽取请求库	第33-34页
·抽取规则库	第34页
·抽取结果数据库	第34-35页
·本章小结	第35-36页
第四章 WEB 文档预处理	第36-44页
·预处理概述	第36-37页
·HTML 文档的清理	第37-40页
·HTML 与XHTML	第37-38页
·文档清理工具	第38页
·文档对象模型（Document Object Model，DOM）	第38-39页
·HTML 文档解析	第39-40页
·DOM 树过滤	第40-43页
·过滤基础	第40-41页
·过滤算法	第41-43页
·本章小结	第43-44页
第五章基于BP 神经网络的规则学习	第44-64页
·人工神经网络（ARTIFICIAL NEURAL NETWORK）基础	第44-47页
·人工神经元	第44-45页
·连接模式	第45-46页
·计算输出信号	第46-47页
·网页的目标语义模式	第47-49页
·规则的生成依据	第49-50页
·抽取规则的表示	第50-53页
·基于神经网络的规则学习	第53-63页
·神经网络模型的设计	第53-55页
·DOM 树结构分析	第54-55页
·选择合适的网络模型	第55页
·BP 网络模型的结构	第55-57页
·反向传播（BP）学习算法	第57-59页
·学习算法原理	第57-58页
·算法步骤	第58-59页
·BP 网络训练	第59-61页
·生成抽取规则	第61-63页
·本章小结	第63-64页
第六章 WEB 信息抽取系统实现	第64-72页
·信息抽取	第64-66页
·系统实现	第66-69页
·系统模块之间的通信	第66页
·网页预处理模块	第66-68页
·规则学习和信息抽取模块	第68-69页
·试验结果与分析	第69-72页
第七章总结与展望	第72-74页
·论文工作总结	第72页
·下一步工作	第72-74页
致谢	第74-75页
参考文献	第75-78页
攻硕期间取得的研究成果	第78页