首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于聚焦爬虫技术的Web本体采集系统的设计与实现

摘要第1-6页
Abstract第6-11页
第1章 绪论第11-16页
   ·论文选题背景第11-12页
   ·论文的研究意义第12-14页
   ·本体采集的国内外研究现状第14页
   ·本文的主要内容第14-16页
第2章 网络爬虫技术原理第16-22页
   ·网络爬虫的作用第16-17页
   ·通用网络爬虫工作流程第17-18页
   ·通用爬虫的结构第18页
   ·聚焦爬虫的流程第18-20页
   ·聚焦爬虫的结构第20-22页
第3章 系统相关技术研究第22-40页
   ·HTTP 协议第22页
   ·网页描述语言第22-24页
   ·Web 访问第24-25页
   ·URL 简介第25页
   ·相对地址和绝对地址第25-26页
   ·链接评价算法第26-27页
   ·向量空间模型简介第27-33页
     ·相关概念第29-30页
     ·特征选取第30页
     ·特征抽取第30-32页
     ·特征权的计算第32-33页
   ·本体文档和本体描述语言第33-37页
     ·XML第34页
     ·RDF第34-35页
     ·RDFS第35-36页
     ·OWL第36-37页
   ·本文所处理的本体文档类型第37页
   ·本体构建第37-40页
第4章 基于聚焦爬虫的本体采集系统设计第40-51页
   ·需求分析第40-41页
   ·初始种子网页的选定第41-42页
   ·网页信息解析第42-46页
     ·网页中链接的提取方法第42-44页
     ·页面正文的提取方法第44-45页
     ·Web 访问和页面处理的步骤第45-46页
   ·链接评价的实现第46-47页
   ·本体文档的处理第47-50页
     ·本体构建的过程第47-49页
     ·本体构建过程中的一些问题第49-50页
   ·一些特殊的启发式处理第50-51页
第5章 系统实现和运行结果第51-55页
   ·系统体系结构第51-52页
   ·系统运行结果第52-55页
     ·案例第52-54页
     ·系统特点第54-55页
第6章 总结和展望第55-57页
   ·总结第55-56页
   ·展望第56-57页
参考文献第57-59页
作者简介第59-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:基于CAN总线的嵌入式车载信息管理单元的设计与实现
下一篇:基于网格矩阵码的烟花爆竹监管平台的研究