首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web信息自动抽取技术的研究

摘要第1-5页
ABSTRACT第5-10页
第一章 引言第10-16页
   ·论文选题及研究意义第10-11页
   ·Web 信息自动抽取技术发展历史第11-12页
   ·Web 信息自动抽取技术的研究现状第12-14页
   ·本文的研究内容第14页
   ·论文结构第14-16页
第二章 Web 信息自动抽取技术综述第16-30页
   ·Web 信息自动抽取技术分类第17-24页
     ·基于自然语言理解(NLP)的信息抽取第17-18页
     ·基于包装器归纳的信息抽取第18-20页
     ·基于 HTML 结构的信息抽取第20-23页
     ·基于 Web 查询技术的信息抽取第23页
     ·基于本体(ontology)方式的信息抽取第23页
     ·基于模型(Modeling-based)的信息抽取第23-24页
   ·Web 信息自动抽取技术的比较第24-28页
   ·Web 信息抽取的评价指标第28页
   ·Web 信息自动抽取存在的问题第28-29页
   ·本章小结第29-30页
第三章 Web 信息抽取技术的基础研究第30-40页
   ·智能 Web 爬虫第30-32页
   ·网页预处理技术第32-33页
   ·浏览器 DOM 模型第33-39页
     ·浏览器内核第34-35页
     ·DOM 模型第35-37页
     ·DOM 框架结构第37-39页
   ·本章小结第39-40页
第四章 基于模型的信息抽取技术第40-59页
   ·基本概念定义第40-46页
     ·定义 1:RPath第40-41页
     ·定义 2:IPath第41-42页
     ·定义 3:IPATH2第42-46页
   ·基于模型的信息抽取总体结构第46-47页
   ·抽取规则生成第47-54页
     ·用户操作行为分析第47-49页
     ·三元素第49-50页
     ·IPATH 和 IPATH2 的生成第50-54页
   ·抽取规则解析第54-58页
     ·Script 定义第55页
     ·Script 解析规则第55-58页
   ·本章小结第58-59页
第五章 基于模型的信息抽取技术在 M-IE 系统中的应用第59-70页
   ·M-IE 系统简介第59-60页
   ·M-IE 系统总体设计第60-63页
   ·M-IE 系统模块设计与实现第63-69页
     ·抽取规则生成模块第63-66页
     ·抽取规则解析模块第66-67页
     ·信息过滤模块第67-68页
     ·数据库模块和数据分析模块第68-69页
   ·本章小结第69-70页
第六章 测试与分析第70-78页
   ·测试环境第70页
   ·抽取规则生成测试第70-73页
   ·测试结果分析第73-77页
   ·本章小结第77-78页
第七章 结论第78-80页
   ·总结第78页
   ·下一步工作第78-80页
致谢第80-81页
参考文献第81-86页
攻硕期间取得的成果第86-87页

论文共87页,点击 下载论文
上一篇:万兆以太网CPRI分组传输硬件设计与实现
下一篇:P2P网络信誉模型的研究与仿真