首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于本体和文本特征的Web信息抽取技术研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-11页
   ·研究背景第7页
   ·国内外发展与研究现状第7-9页
   ·本文的研究内容与组织结构第9-11页
第二章 Web信息抽取技术第11-17页
   ·信息抽取技术综述第11-13页
     ·数据的组织形式第11页
     ·信息抽取技术概述第11-12页
     ·Web信息抽取概述第12-13页
   ·Web信息抽取的方法第13-16页
     ·基于自然语言处理方式的信息抽取第13-14页
     ·基于包装器归纳方式的信息抽取第14页
     ·基于本体方式的信息抽取第14-15页
     ·基于HTML结构的信息抽取第15页
     ·基于Web查询的信息抽取第15-16页
   ·小结第16-17页
第三章 相关理论与关键技术研究第17-29页
   ·本体的基本理论第17-20页
     ·本体的形式化定义第17-18页
     ·本体的特点第18页
     ·本体的描述语言第18-20页
   ·本体的构建第20-25页
     ·本体的构建准则第20-21页
     ·本体的构建方法第21-23页
     ·本体的构建工具第23-25页
   ·Web相关技术第25-28页
     ·XML概述第25-26页
     ·文档对象模型DOM第26-27页
     ·XPath技术第27-28页
   ·小结第28-29页
第四章 基于本体和文本特征的Web信息抽取方法第29-41页
   ·使用文本特征的噪音处理方法第29-34页
     ·基于文本分块的噪音处理第29-30页
     ·基于文本密度的噪音处理第30-31页
     ·阈值估计算法第31-33页
     ·基于文本标签的噪音处理第33-34页
   ·本体导向的规则系统第34-39页
     ·构建本体第34-36页
     ·本体解析第36-39页
     ·抽取规则的生成第39页
   ·小结第39-41页
第五章 系统的设计与实现第41-53页
   ·预处理阶段第42-45页
     ·页面文档清洗第42-43页
     ·编码转换第43-44页
     ·页面解析第44-45页
     ·噪音处理第45页
   ·规则生成与信息抽取第45-47页
   ·数据库的设计第47页
   ·系统的运行实现第47-49页
   ·系统评测及结果第49-51页
     ·评测方法第49-50页
     ·评测结果及分析第50-51页
   ·小结第51-53页
第六章 总结与展望第53-55页
   ·研究工作的总结第53页
   ·趋势与展望第53-55页
致谢第55-57页
参考文献第57-61页

论文共61页,点击 下载论文
上一篇:基于粒子滤波的低剂量CT图像去噪
下一篇:基于面向对象技术的监控组态软件系统的设计与实现