首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于领域本体的主题爬虫研究及实现

摘要第1-7页
Abstract第7-11页
第1章 绪论第11-15页
   ·课题研究背景和意义第11-12页
   ·主题网络爬虫国内外研究现状分析第12-13页
   ·论文内容安排第13-15页
第2章 相关理论知识第15-29页
   ·语义网第15-16页
     ·语义网的概念第15页
     ·语义网体系结构第15-16页
   ·本体(Ontology)第16-20页
     ·本体的定义第16-17页
     ·本体的构成第17-18页
     ·本体的分类法第18-19页
     ·本体描述语言第19-20页
   ·本体的构建第20-24页
     ·本体构建的原则第20-21页
     ·领域本体的构建方法第21-22页
     ·本体开发工具第22-24页
   ·主题爬虫的相关理论与技术第24-26页
     ·网络爬虫的概念第24页
     ·网络爬虫的模型第24-26页
     ·通用网络爬虫与主题爬虫的工作流程对比第26页
   ·主题相关性算法-向量空间模型(VSM)第26-28页
   ·本章小结第28-29页
第3章 基于领域本体的主题爬虫总体设计第29-33页
   ·关于主题爬虫第29页
   ·主题爬虫性能评价指标第29-30页
   ·基于领域本体的主题爬虫系统设计第30-32页
     ·系统设计的目标第30页
     ·系统框架结构第30-31页
     ·系统功能模块第31-32页
   ·本章小结第32-33页
第4章 基于领域本体的上下文主题描述及网页相关度计算第33-44页
   ·基于领域本体的上下文主题描述第33-36页
     ·主题描述方法第33-34页
     ·主题描述方法的研究应用与问题第34-35页
     ·基于领域本体的上下文主题描述第35-36页
   ·基于领域本体的主题集合向量表示第36-41页
     ·领域本体内的概念语义相似度计算第36-38页
     ·领域本体内的概念语义相关度计算第38-39页
     ·结合领域本体的概念相似度与相关度综合量化方法第39页
     ·领域本体内概念相似度与相关度综合量化实验第39-40页
     ·主题关键词集合及主题描述的向量表示第40-41页
   ·基于领域本体的网页相关度分析第41-43页
     ·基于本体的网页内容相关度分析第41-42页
     ·基于领域本体的链接相关度分析第42-43页
   ·本章小结第43-44页
第5章 基于领域本体的主题爬虫系统实现第44-57页
   ·教育技术领域本体的构建第44-47页
   ·基于领域本体的主题爬虫的流程图第47页
   ·主要功能模块及关键技术实现第47-52页
     ·多线程技术第47-49页
     ·协议分析处理与页面采集第49页
     ·URL优先级队列模块第49-50页
     ·页面预处理模块第50-51页
     ·页面分词模块及相关度分析模块第51页
     ·链接分析模块第51页
     ·领域本体层次树第51-52页
   ·实验结果及分析第52-56页
     ·系统开发运行环境第52页
     ·考查的性能指标第52-53页
     ·实验及结果评价第53-56页
   ·本章小结第56-57页
总结与展望第57-58页
致谢第58-59页
参考文献第59-64页
在学期间发表的学术论文和参加科研情况第64-65页

论文共65页,点击 下载论文
上一篇:转向架动应力测试数据分析软件设计及应用
下一篇:Linux应用程序多核并行化方法研究与实现