基于聚焦爬虫技术的Web本体采集系统的设计与实现

摘要	第1-6页
Abstract	第6-11页
第1章绪论	第11-16页
·论文选题背景	第11-12页
·论文的研究意义	第12-14页
·本体采集的国内外研究现状	第14页
·本文的主要内容	第14-16页
第2章网络爬虫技术原理	第16-22页
·网络爬虫的作用	第16-17页
·通用网络爬虫工作流程	第17-18页
·通用爬虫的结构	第18页
·聚焦爬虫的流程	第18-20页
·聚焦爬虫的结构	第20-22页
第3章系统相关技术研究	第22-40页
·HTTP 协议	第22页
·网页描述语言	第22-24页
·Web 访问	第24-25页
·URL 简介	第25页
·相对地址和绝对地址	第25-26页
·链接评价算法	第26-27页
·向量空间模型简介	第27-33页
·相关概念	第29-30页
·特征选取	第30页
·特征抽取	第30-32页
·特征权的计算	第32-33页
·本体文档和本体描述语言	第33-37页
·XML	第34页
·RDF	第34-35页
·RDFS	第35-36页
·OWL	第36-37页
·本文所处理的本体文档类型	第37页
·本体构建	第37-40页
第4章基于聚焦爬虫的本体采集系统设计	第40-51页
·需求分析	第40-41页
·初始种子网页的选定	第41-42页
·网页信息解析	第42-46页
·网页中链接的提取方法	第42-44页
·页面正文的提取方法	第44-45页
·Web 访问和页面处理的步骤	第45-46页
·链接评价的实现	第46-47页
·本体文档的处理	第47-50页
·本体构建的过程	第47-49页
·本体构建过程中的一些问题	第49-50页
·一些特殊的启发式处理	第50-51页
第5章系统实现和运行结果	第51-55页
·系统体系结构	第51-52页
·系统运行结果	第52-55页
·案例	第52-54页
·系统特点	第54-55页
第6章总结和展望	第55-57页
·总结	第55-56页
·展望	第56-57页
参考文献	第57-59页
作者简介	第59-60页
致谢	第60页