首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

一个Web本体的采集系统

摘要第1-5页
Abstract第5-8页
第一章 前言第8-13页
   ·研究背景第8-9页
   ·本文研究工作的缘起、意义及具体任务第9-11页
     ·本体的应用第9-10页
     ·本文研究工作的意义及具体研究内容第10-11页
   ·相关领域的研究现状第11页
   ·本文的内容安排第11-13页
第二章 Web 信息采集原理及相关技术第13-29页
   ·信息检索与搜索引擎概述第13-16页
     ·信息检索第13-14页
     ·搜索引擎第14-16页
   ·Web 爬虫及聚焦爬虫概述第16-17页
   ·聚焦爬虫搜索目标描述第17页
   ·Web 主题分布特性及聚焦爬虫搜索策略第17-18页
     ·主题分布特性第17-18页
     ·广度优先策略第18页
     ·最佳优先策略第18页
   ·网页分析算法第18-21页
     ·基于网络拓扑的网页分析算法第18-19页
     ·基于网页内容的网页分析算法第19-21页
     ·用户协作网页分析算法第21页
     ·基于领域概念定制的网页评价算法第21页
   ·聚焦爬虫系统结构第21-24页
     ·基于分类器的聚焦爬虫第21-22页
     ·基于数据抽取器的聚焦爬虫第22-23页
     ·基于用户行为学习的聚焦爬虫第23-24页
   ·向量空间模型(VSM)基础第24-26页
     ·主要概念第24页
     ·项的选择第24-25页
     ·特征抽取第25页
     ·特征权计算第25-26页
   ·HTTP 协议基础第26-29页
     ·HTTP 的工作方式第26页
     ·Web 客户第26-27页
     ·Web 服务器第27-29页
第三章 基于聚焦爬虫的本体搜索技术第29-35页
   ·Web 本体分布特性第29-30页
   ·基本搜索过程第30-32页
     ·URL Frontier 与URL 的来源第30-31页
     ·Web 访问第31页
     ·页面处理第31-32页
   ·链接评价第32-34页
     ·评价方法第32-33页
     ·基于VSM 的链接评价第33-34页
   ·对聚焦搜索的增强第34-35页
第四章 系统分析与设计第35-42页
   ·系统概述第35页
   ·需求分析第35-36页
   ·概要设计第36-37页
   ·详细设计第37-42页
     ·系统功能模块第37-38页
     ·核心功能的逻辑流程第38-40页
     ·主要设计类图第40-42页
第五章 系统实现关键技术第42-50页
   ·HTML 文档处理第42-43页
     ·HTML 文档结构第42页
     ·基本处理思路第42-43页
   ·链接评价的实现第43-45页
     ·链接评价过程第44页
     ·VSM 链接评价的实现第44-45页
   ·多线程的控制与实现第45-50页
     ·线程数量的增减控制第46-47页
     ·URL 的派发第47-50页
第六章 总结与展望第50-54页
   ·WebOnto Crawler 的搜索方法评价第50-52页
     ·Web 搜索的必要性分析第50-51页
     ·链接评价方法合理性分析与性能评价第51-52页
   ·WebOnto Crawler 与相关研究的比较第52页
   ·本文工作总结第52-53页
   ·展望第53-54页
参考文献第54-56页
致谢第56-57页
作者简介第57页

论文共57页,点击 下载论文
上一篇:三峡地下厂房围岩施工期变形监测模型研究
下一篇:MATLAB在大学物理中的应用