首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于HTML的Web信息抽取技术的研究与应用

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-15页
   ·课题研究背景第10页
   ·信息抽取的发展及国内外研究现状第10-12页
     ·信息抽取的概念与发展第10-11页
     ·信息抽取的国内外研究现状第11-12页
   ·Web信息抽取的发展及研究现状第12-13页
   ·本论文研究的主要内容第13-14页
   ·论文的组织结构第14-15页
第2章 信息抽取技术及相关技术概述第15-29页
   ·Web信息抽取的含义第15页
   ·Web信息抽取的几种方式第15-22页
     ·基于自然语言处理方式的信息抽取第16-17页
     ·基于本体方式的信息抽取第17-18页
     ·基于包装器归纳的信息抽取第18-19页
     ·基于HTML结构的信息抽取第19-20页
     ·基于Web查询的信息抽取第20-21页
     ·其它几种信息抽取方式第21-22页
   ·相关技术及工作基础第22-28页
     ·文本聚类技术简述第22-23页
     ·人工神经网络简述第23-25页
     ·相关基础工作简述第25-28页
   ·本章小结第28-29页
第3章 基于HTML的Web信息抽取技术的研究第29-54页
   ·新闻列表页特征的深入探讨第29-31页
   ·页面结构特征及问题的提出第31-34页
   ·Web信息抽取流程第34-37页
   ·基于文本聚类算法的目标网页检索第37-41页
     ·探寻目标网页算法设计第37-40页
     ·算法描述第40-41页
   ·HTML页面的预处理第41-45页
     ·HTML到XML的格式转换第41-43页
     ·XML文档解析第43-45页
   ·信息抽取技术的设计第45-52页
     ·基于BP神经网络的新闻列表页的抽取规则的设计第45-49页
     ·基于BP神经网络的新闻正文页的抽取规则的设计第49-52页
   ·信息抽取规则的建立第52页
   ·本章小结第52-54页
第4章 应用实例-原型系统的信息抽取实现及性能评测第54-61页
   ·原型系统信息抽取的整体设计第54页
   ·开发环境及系统结构简述第54-55页
   ·系统操作界面及其功能介绍第55-58页
   ·信息抽取系统的评测指标第58-59页
   ·实验结果评价及系统性能分析第59-60页
   ·本章小结第60-61页
结论第61-63页
参考文献第63-66页
攻读硕士学位期间发表的论文和取得的科研成果第66-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:面向电子政务的SOAP消息安全模型及应用
下一篇:嵌入式网页过滤装置设计