首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web信息自动抽取技术的研究与实现

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-15页
   ·课题研究的背景和意义第9-10页
   ·课题研究的现状第10-13页
     ·信息抽取的发展简史第10-11页
     ·国外研究现状第11-12页
     ·国内研究现状第12-13页
   ·本文研究的关键问题第13-14页
   ·本文组织结构第14-15页
第2章 Web信息抽取技术综述第15-22页
   ·Web信息抽取技术的相关概念第15-16页
   ·Web信息抽取技术分类及技术分析第16-19页
     ·基于自然语言处理方式的信息抽取(NLP)第16-17页
     ·包装器归纳方式的信息抽取第17页
     ·基于ontology方式的信息抽取第17-18页
     ·基于HTML结构的信息抽取第18-19页
     ·基于Web查询的信息抽取第19页
   ·Web信息抽取的评价指标第19-20页
   ·Web信息抽取存在的问题第20-21页
   ·本章小结第21-22页
第3章 网页预处理技术的研究第22-39页
   ·网页预处理过程中存在的问题第23页
   ·各种文档的分析第23-34页
     ·HTML文档分析第23-25页
     ·XML文档分析第25-29页
     ·XHTML文档分析第29-31页
     ·DOM简介第31-34页
   ·网页的预处理第34-37页
     ·清洗页面文档第34-37页
     ·页面解析第37页
   ·本章小结第37-39页
第4章 基于树结构的Web信息自动抽取方法第39-53页
   ·网页获取第41-42页
   ·噪声处理第42-43页
   ·页面包装器(Wrapper)自动生成算法的研究第43-50页
     ·RoadRunner算法简介第43-47页
     ·基于树结构的匹配算法第47-50页
   ·数据项的语义分析算法第50-51页
   ·数据抽取算法的研究第51-52页
     ·数据抽取过程第51-52页
     ·数据存储研究第52页
   ·本章小结第52-53页
第5章 系统设计与实现第53-61页
   ·总体设计第53-54页
   ·开发工具介绍和分析第54-55页
     ·开发工具第54页
     ·开发工具的介绍和分析第54-55页
   ·用户界面介绍第55-59页
   ·实验结果分析第59-60页
   ·本章小结第60-61页
第6章 总结与展望第61-63页
   ·总结第61-62页
   ·展望第62-63页
参考文献第63-67页
致谢第67-68页
附录第68页
 攻读硕士学位期间公开发表的论文和参加的项目第68页

论文共68页,点击 下载论文
上一篇:基于AOP和Acegi的访问控制技术的研究与应用
下一篇:跨域鉴别与授权研究