基于Hadoop的物联网(WoT)搜索引擎设计与实现
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第10-16页 |
1.1 课题背景及必要性 | 第10-11页 |
1.1.1 选题背景 | 第10页 |
1.1.2 课题必要性 | 第10-11页 |
1.2 国内外研究现状 | 第11-13页 |
1.2.1 物联网搜索技术研究现状 | 第11-12页 |
1.2.2 查询扩展技术研究现状 | 第12-13页 |
1.3 课题研究工作的主要内容 | 第13-14页 |
1.4 论文组织结构 | 第14-16页 |
第二章 相关理论及关键技术研究 | 第16-33页 |
2.1 相关理论研究 | 第16-22页 |
2.1.1 面向互联网的传统搜索引擎工作原理 | 第16-17页 |
2.1.2 本体论 | 第17-21页 |
2.1.2.1 本体定义 | 第17页 |
2.1.2.2 本体组成 | 第17-18页 |
2.1.2.3 本体描述语言 | 第18-21页 |
2.1.3 基于规则的本体推理 | 第21-22页 |
2.1.3.1 推理的定义及分类 | 第21页 |
2.1.3.2 推理规则 | 第21-22页 |
2.1.3.3 基于规则的推理 | 第22页 |
2.2 关键技术研究 | 第22-31页 |
2.2.1 开源分布式计算平台Hadoop | 第22-25页 |
2.2.1.1 认识Hadoop | 第22-23页 |
2.2.1.2 Hadoop集群架构 | 第23页 |
2.2.1.3 Hadoop存储系统HDFS | 第23-24页 |
2.2.1.4 MapReduce编程模型 | 第24-25页 |
2.2.2 分布式倒排索引的两种组织策略 | 第25-28页 |
2.2.2.1 单词-文档矩阵 | 第25页 |
2.2.2.2 按文档划分 | 第25-27页 |
2.2.2.3 按单词划分 | 第27-28页 |
2.2.2.4 两种策略的比较 | 第28页 |
2.2.3 开源核心搜索库Lucene | 第28-31页 |
2.2.3.1 Lucene简介 | 第28-30页 |
2.2.3.2 Lucene索引技术 | 第30-31页 |
2.2.3.3 Lucene检索技术 | 第31页 |
2.3 本章小结 | 第31-33页 |
第三章 本体的规则推理及基于本体的查询扩展 | 第33-46页 |
3.1 基于规则的本体推理 | 第33-38页 |
3.1.1 Jena结构 | 第33-34页 |
3.1.2 Jena推理机制 | 第34-35页 |
3.1.3 Jena推理规则的构建 | 第35-36页 |
3.1.4 推理的实现 | 第36-38页 |
3.2 基于本体的查询扩展 | 第38-45页 |
3.2.1 分词 | 第39-40页 |
3.2.2 基于本体的查询扩展算法 | 第40-44页 |
3.2.2.1 基于本体的初始类词汇扩展算法 | 第40-41页 |
3.2.2.2 基于本体的最终类词汇扩展算法 | 第41-42页 |
3.2.2.3 基于本体的实例词汇扩展算法 | 第42-44页 |
3.2.3 查询扩展的实现 | 第44-45页 |
3.3 本章小结 | 第45-46页 |
第四章 物联网(WoT)搜索引擎的设计与实现 | 第46-68页 |
4.1 分布式倒排索引系统的需求分析 | 第47-49页 |
4.1.1 需求定义 | 第47页 |
4.1.2 用例模型 | 第47-49页 |
4.2 分布式倒排索引系统的概要设计 | 第49-53页 |
4.2.1 分布式倒排索引系统总体架构设计 | 第49-50页 |
4.2.2 业务子系统架构设计 | 第50-52页 |
4.2.2.1 分布式索引子系统架构设计 | 第50-51页 |
4.2.2.2 分布式查询子系统架构设计 | 第51-52页 |
4.2.3 分布式存储子系统设计 | 第52-53页 |
4.3 分布式倒排索引系统的详细设计与实现 | 第53-65页 |
4.3.1 分布式索引子系统详细设计与实现 | 第53-60页 |
4.3.1.1 系统管理模块 | 第54页 |
4.3.1.2 静态变量模块 | 第54页 |
4.3.1.3 HDFS文件处理模块 | 第54-56页 |
4.3.1.4 XML文档解析模块 | 第56-57页 |
4.3.1.5 分布式索引生成模块 | 第57-60页 |
4.3.2 分布式查询子系统详细设计与实现 | 第60-65页 |
4.3.2.1 系统管理模块 | 第61页 |
4.3.2.2 自定义数据类型模块 | 第61-62页 |
4.3.2.3 分布式查询模块 | 第62-65页 |
4.4 基于距离的感知设备排序算法 | 第65-66页 |
4.5 搜索引擎运行界面展示 | 第66-67页 |
4.6 本章小结 | 第67-68页 |
第五章 测试与分析 | 第68-73页 |
5.1 测试环境 | 第68-70页 |
5.2 分布式倒排索引系统测试 | 第70-71页 |
5.3 查全率测试 | 第71-72页 |
5.4 本章小结 | 第72-73页 |
第六章 总结与展望 | 第73-75页 |
参考文献 | 第75-78页 |
致谢 | 第78页 |