首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于主题爬行和本体发现特定领域深度网入口的研究

提要第1-7页
第1章 绪论第7-13页
   ·研究背景第7页
   ·研究现状第7-11页
     ·深度网数据库搜索策略的研究第7-8页
     ·识别深度网数据库查询接口的研究第8-9页
     ·深度网查询接口分类的研究第9-11页
     ·现有的深度网入口发现系统第11页
   ·研究思路的提出第11页
   ·本文的主要工作和结构第11-13页
第2章 相关知识第13-21页
   ·主题爬行第13-17页
     ·主题爬行技术原理第13页
     ·主题爬行的一般框架第13-15页
     ·主题爬行的爬行策略第15-17页
   ·本体相关理论第17-21页
     ·本体概念第17-18页
     ·本体的形式化定义第18-19页
     ·WordNet 简介第19-21页
第3章 特定领域深度网入口发现的研究第21-38页
   ·基于链接的主题相关性判别第22-25页
     ·链接上下文的提取第23-24页
     ·主题特征词集的建立第24-25页
   ·基于网页内容的主题相关性判别第25-31页
     ·提取文本特征第25-26页
     ·空间向量模型第26页
     ·基于 WordNet 建立文本特征向量第26-29页
     ·文本分类算法第29-31页
   ·深度网入口识别第31-33页
     ·表单类型第31-32页
     ·表单分类策略第32页
     ·启发式规则第32-33页
   ·基于本体识别特定领域深度网入口第33-38页
     ·表单标签的提取第33-35页
     ·领域本体与属性标签匹配算法第35-38页
第4章 特定领域深度网入口发现的设计与实现第38-47页
   ·基于 Protégé2000 的本体构建第38-40页
     ·本体构建工具 Protégé2000第38页
     ·构建图书领域本体第38-40页
   ·系统的设计和实现第40-44页
     ·系统的框架第40页
     ·基于链接上下文的主题爬行模块第40-41页
     ·深度网入口识别模块第41-42页
     ·基于领域本体的主题相关性分析模块第42-44页
   ·实验与结果分析第44-47页
     ·系统实现所使用的技术第44页
     ·评价指标第44-45页
     ·实验设计第45页
     ·实验分析结果第45-47页
第5章 结论与展望第47-49页
   ·本文结论第47页
   ·未来工作第47-49页
参考文献第49-52页
致谢第52-53页
摘要第53-55页
Abstract第55-57页

论文共57页,点击 下载论文
上一篇:文件系统的分布式全备份与递增备份研究
下一篇:基于工作流的公安物证信息管理系统的设计与实现