智慧搜索引擎软件体系结构设计及其关键技术研究
摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第一章 绪论 | 第12-15页 |
1.1 研究背景及意义 | 第12-13页 |
1.2 问题定义 | 第13-14页 |
1.3 研究内容 | 第14页 |
1.4 本文结构 | 第14-15页 |
第二章 相关研究 | 第15-28页 |
2.1 搜索引擎相关研究 | 第15-21页 |
2.1.1 搜索引擎发展历史 | 第15-16页 |
2.1.2 搜索引擎分类 | 第16-18页 |
2.1.3 搜索引擎应用现状 | 第18-21页 |
2.2 搜索引擎技术方法相关研究 | 第21-27页 |
2.2.1 搜索引擎研究与设计 | 第21-22页 |
2.2.2 基于本体的语义信息抽取相关研究 | 第22-25页 |
2.2.3 软件体系结构相关研究 | 第25-27页 |
2.3 本章小结 | 第27-28页 |
第三章 领域分析 | 第28-39页 |
3.1 领域边界 | 第28-31页 |
3.1.1 领域系统结构 | 第28-30页 |
3.1.2 数据流分析 | 第30-31页 |
3.2 角色模型 | 第31-34页 |
3.2.3 匿名搜索者角色模型 | 第31-32页 |
3.2.4 注册搜索者角色模型 | 第32-33页 |
3.2.5 平台管理员角色模型 | 第33-34页 |
3.3 业务模型 | 第34-35页 |
3.3.1 爬取任务管理 | 第34页 |
3.3.2 抽取任务管理 | 第34-35页 |
3.3.3 索引任务管理 | 第35页 |
3.4 信息模型 | 第35-36页 |
3.5 领域本体 | 第36-37页 |
3.6 领域字典 | 第37-38页 |
3.7 本章小结 | 第38-39页 |
第四章 领域设计 | 第39-55页 |
4.1 构件设计 | 第39-54页 |
4.1.1 总体构件设计 | 第39-40页 |
4.1.2 实体构件设计 | 第40-43页 |
4.1.3 实体管理构件设计 | 第43-49页 |
4.1.4 任务处理构件设计 | 第49页 |
4.1.5 任务执行构件设计 | 第49-52页 |
4.1.6 工具构件 | 第52-54页 |
4.2 本章小结 | 第54-55页 |
第五章 基于本体的网页语义信息抽取 | 第55-65页 |
5.1 前言 | 第55页 |
5.2 领域本体实例扩充方法分析 | 第55-57页 |
5.2.1 结构化数据 | 第55页 |
5.2.2 半结构化数据 | 第55-56页 |
5.2.3 非结构化数据 | 第56-57页 |
5.3 语义信息抽取流程设计 | 第57页 |
5.4 基于统计的本体实例扩充方法 | 第57-64页 |
5.4.1 概述 | 第57-58页 |
5.4.2 最大熵原理 | 第58-59页 |
5.4.3 特征选择 | 第59-60页 |
5.4.4 利用本体概念的层次进行实例学习 | 第60-61页 |
5.4.5 实现方法及实验结果 | 第61-64页 |
5.5 本章小结 | 第64-65页 |
第六章 领域实现 | 第65-68页 |
6.1 实现目标 | 第65页 |
6.2 功能设计 | 第65-66页 |
6.3 领域实现展示 | 第66-67页 |
6.4 本章小结 | 第67-68页 |
第七章 总结与展望 | 第68-70页 |
7.1 总结 | 第68-69页 |
7.2 展望 | 第69-70页 |
参考文献 | 第70-73页 |
发表论文和参加科研情况说明 | 第73-74页 |
致谢 | 第74页 |