首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于神经网络的Web信息抽取系统的研究与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-13页
   ·研究背景第9-10页
     ·信息抽取(Information Extraction: IE)第9-10页
     ·Web 信息抽取(Web information extraction)第10页
   ·研究现状第10-11页
   ·本文研究内容第11-12页
   ·论文结构安排第12-13页
第二章 WEB 信息抽取概述第13-26页
   ·IE 的发展历史与现状第13-15页
   ·IE 的任务第15-16页
   ·WEB 信息抽取技术分类第16-21页
     ·基于HTML 结构的方式第17页
     ·基于自然语言处理的方式第17-19页
     ·包装器归纳(Wrapper Induction)方式第19-20页
     ·基于Ontology 的方式第20-21页
   ·半结构化数据及XML 技术的应用第21-22页
   ·WEB 信息抽取与机器学习第22-24页
     ·抽取规则的生成第22-23页
     ·机器学习方法第23-24页
   ·评价指标第24-25页
   ·小结第25-26页
第三章 WEB 信息抽取系统框架结构第26-36页
   ·系统目标和分析第26-29页
     ·系统目标第26页
     ·系统分析第26-28页
     ·XML 在系统中的作用第28-29页
   ·系统框架和整体流程第29-32页
   ·系统知识库第32-35页
     ·目标语义模式库第32-33页
     ·抽取请求库第33-34页
     ·抽取规则库第34页
     ·抽取结果数据库第34-35页
   ·本章小结第35-36页
第四章 WEB 文档预处理第36-44页
   ·预处理概述第36-37页
   ·HTML 文档的清理第37-40页
     ·HTML 与XHTML第37-38页
     ·文档清理工具第38页
     ·文档对象模型(Document Object Model,DOM)第38-39页
     ·HTML 文档解析第39-40页
   ·DOM 树过滤第40-43页
     ·过滤基础第40-41页
     ·过滤算法第41-43页
   ·本章小结第43-44页
第五章 基于BP 神经网络的规则学习第44-64页
   ·人工神经网络(ARTIFICIAL NEURAL NETWORK)基础第44-47页
     ·人工神经元第44-45页
     ·连接模式第45-46页
     ·计算输出信号第46-47页
   ·网页的目标语义模式第47-49页
   ·规则的生成依据第49-50页
   ·抽取规则的表示第50-53页
   ·基于神经网络的规则学习第53-63页
     ·神经网络模型的设计第53-55页
       ·DOM 树结构分析第54-55页
       ·选择合适的网络模型第55页
     ·BP 网络模型的结构第55-57页
     ·反向传播(BP)学习算法第57-59页
       ·学习算法原理第57-58页
       ·算法步骤第58-59页
     ·BP 网络训练第59-61页
     ·生成抽取规则第61-63页
   ·本章小结第63-64页
第六章 WEB 信息抽取系统实现第64-72页
   ·信息抽取第64-66页
   ·系统实现第66-69页
     ·系统模块之间的通信第66页
     ·网页预处理模块第66-68页
     ·规则学习和信息抽取模块第68-69页
   ·试验结果与分析第69-72页
第七章 总结与展望第72-74页
   ·论文工作总结第72页
   ·下一步工作第72-74页
致谢第74-75页
参考文献第75-78页
攻硕期间取得的研究成果第78页

论文共78页,点击 下载论文
上一篇:三峡库区塌岸预测与防治措施研究--以重庆市万州区为例
下一篇:铜阀锻前加热系统的设计及其温度控制系统的研究