首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于领域本体的主题爬虫系统研究与实现

摘要第1-6页
ABSTRACT第6-11页
第一章 绪论第11-18页
   ·研究背景和意义第11-12页
   ·国内外研究现状第12-16页
   ·课题研究主要内容第16页
   ·论文的组织结构第16-18页
第二章 相关理论与技术第18-34页
   ·WEB 搜索引擎概述第18-20页
     ·搜索引擎的概念第18-19页
     ·搜索引擎的分类第19-20页
   ·蜘蛛爬虫概述第20-26页
     ·蜘蛛爬虫概念第20-21页
     ·通用网络爬虫模型第21-24页
     ·主题网络爬虫模型第24-26页
   ·本体概述第26-28页
     ·本体的概念第26-27页
     ·本体描述语言——OWL第27页
     ·本课题涉及的本体部分第27-28页
   ·超文本传输协议第28-30页
   ·windows 多线程概念第30页
   ·MD5 算法第30-32页
   ·K-means 算法第32-33页
   ·本章小结第33-34页
第三章 主题搜索算法研究与设计第34-54页
   ·网络蜘蛛通用搜索算法第34-36页
   ·主题蜘蛛搜索算法研究第36-44页
     ·基于内容评价的搜索策略第36-37页
     ·基于链接结构的搜索策略第37-40页
     ·基于未来回报价值评价的搜索策略第40-42页
     ·基于综合价值的搜索策略第42-43页
     ·各类搜索策略分析比较第43-44页
   ·基于领域知识本体的系统新算法设计第44-53页
     ·URL 队列优先权排序算法设计第44-49页
     ·基于领域知识本体的页面聚合度排序策略设计第49-53页
   ·本章小结第53-54页
第四章 基于领域本体的网络爬虫系统设计与实现第54-81页
   ·主题爬虫系统整体设计第54-60页
     ·系统架构设计与整体流程第54-56页
     ·数据库设计第56页
     ·主要的类与数据结构第56-60页
   ·主题爬虫系统重点模块实现第60-72页
     ·主题特征词的建立第60-61页
     ·URL 初始种子的确立第61页
     ·爬虫搜集Web 页面模块第61-67页
     ·URL 队列优先权排序算法实现第67-69页
     ·页面主题凝聚度算法实现第69-72页
   ·系统测试第72-80页
     ·实验环境第72-73页
     ·系统相关模块运行情况第73-75页
     ·网页聚合度算法实验情况第75-77页
     ·主题爬虫实验结果分析第77-80页
   ·本章小结第80-81页
第五章 总结与展望第81-83页
致谢第83-84页
参考文献第84-87页
攻读硕士期间取得的科研成果第87-88页

论文共88页,点击 下载论文
上一篇:改进蚁群算法及其在序列比对中的应用
下一篇:动态几何画板的研究及其在iPhone平台的实现