首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于本体的可定制化网页信息智能提取技术研究

摘要第1-3页
Abstract第3-5页
目录第5-7页
第一章 绪论第7-10页
 引言第7-8页
   ·研究背景第8页
   ·论文的主要内容第8-10页
第二章 Web信息提取技术综述第10-19页
   ·信息提取的产生与发展第10-11页
   ·信息检索与信息提取第11-12页
   ·Web信息提取技术的传统途径第12-13页
   ·典型信息提取系统的体系结构第13-15页
   ·代表系统简介第15-16页
     ·ShopBot第15页
     ·WIEN第15页
     ·WHISK第15页
     ·SRV第15-16页
   ·信息提取的相关工作及存在的问题第16-17页
   ·本体论技术以及其在信息提取领域的应用第17-19页
     ·本体论概要第17-18页
     ·本体论在信息提取领域的应用第18-19页
第三章 领域知识的构造第19-25页
   ·OSM模型第19页
   ·ORM模型第19-21页
   ·构建领域知识第21-25页
第四章 结合本体论的网页去噪第25-41页
   ·网络噪音第25-26页
   ·HTML标签树第26-29页
   ·构造HTML标签树及其预处理第29-33页
     ·构造 HTML标签树第29-30页
     ·HTML标签树的简化与统计第30-33页
   ·网页间结构块的比较第33-38页
     ·利用网页间平均信息量排除噪音块算法第33-37页
     ·利用网页间平均信息量排除噪音实验结果第37-38页
   ·页面内信息块的判断第38-40页
     ·页面内信息块判断算法第38-40页
     ·页面内信息块判断实验结果第40页
   ·综合网页间与网页内的评价第40-41页
第五章 基于本体论的数据提取第41-52页
   ·数据区的确定第42-43页
   ·表格记录提取第43-46页
     ·表格分类及其属性第43-44页
     ·行列式表格的提取第44-46页
   ·通用记录提取第46-50页
     ·判定记录分隔符第46-49页
     ·记录分解第49-50页
   ·结合本体论的实体构造第50-52页
第六章 系统框架及实现第52-57页
   ·项目介绍第52-54页
   ·系统特点第54页
   ·系统性能分析第54-57页
     ·Web信息提取技术的评价标准第54-55页
     ·实验结果与分析第55-57页
第七章 总结与展望第57-59页
   ·论文主要工作第57页
   ·未来工作展望第57-59页
参考文献第59-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:MW公司财务评价与分析
下一篇:狄奥尼索斯精神在尤金·奥尼尔剧作中的体现