首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于页面主体提取的WEB信息抽取技术研究

摘要第1-5页
Abstract第5-8页
专用术语注释表第8-10页
第一章 绪论第10-16页
   ·研究背景第10-13页
     ·网页主体提取第10-11页
     ·中介真值程度度量第11-12页
     ·Web 信息抽取第12-13页
   ·研究目标及主要内容第13-14页
   ·本文组织结构第14-16页
第二章 Web 信息抽取第16-23页
   ·Web 信息抽取概念第16-17页
   ·Web 信息抽取方法分类第17-21页
     ·基于自然语言处理的信息抽取第17-18页
     ·基于包装器归纳的信息抽取第18-19页
     ·基于 Ontology 的信息抽取第19页
     ·基于 Web 查询的信息抽取第19-20页
     ·基于视觉特征的信息抽取第20页
     ·基于 HTML 的信息抽取第20-21页
   ·Web 信息抽取方法评价指标第21-22页
   ·本章小结第22-23页
第三章 基于 MMTD 的页面主体提取第23-38页
   ·HTML 与 XML第23-25页
     ·HTML第23-24页
     ·XML第24-25页
   ·页面预处理第25-28页
     ·页面整理第25-27页
     ·页面去噪第27-28页
   ·基于 MMTD 的页面主体提取第28-35页
     ·HTMLParser第28-29页
     ·MMTD第29-31页
     ·页面主体特征分析第31-34页
     ·提取算法第34-35页
   ·实验第35-37页
   ·本章小结第37-38页
第四章 基于页面主体提取的 WEB 信息抽取方法第38-50页
   ·基于页面主体提取的 Web 信息抽取方法概述第38-39页
   ·抽取规则的生成第39-47页
     ·XPATH第39-41页
     ·XSLT第41-42页
     ·信息定位第42-44页
     ·路径转换及生成抽取规则第44-47页
   ·信息抽取第47-49页
   ·本章小结第49-50页
第五章 基于页面主体提取的 WEB 信息抽取设计与实现第50-57页
   ·系统设计目标第50-51页
   ·系统总体设计第51-53页
     ·功能模块设计第51-52页
     ·体系结构设计第52-53页
   ·系统的实现与测试第53-56页
     ·系统开发工具介绍第53-54页
     ·系统操作界面第54-55页
     ·实验及结果分析第55-56页
   ·本章小结第56-57页
第六章 总结与展望第57-59页
   ·本文工作总结第57页
   ·未来工作展望第57-59页
参考文献第59-62页
附录 1 攻读硕士学位期间撰写的论文第62-63页
附录 2 攻读硕士学位期间参加的科研项目第63-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:基于BPEL文档验证的Web服务组合入侵检测技术研究
下一篇:分层多环Chord协议的研究及其应用