非结构化数据统一访问平台及索引技术研究
表目录 | 第1-8页 |
图目录 | 第8-10页 |
摘要 | 第10-11页 |
ABSTRACT | 第11-12页 |
第一章 绪论 | 第12-20页 |
·研究背景与意义 | 第12-13页 |
·国内外研究现状 | 第13-17页 |
·数据集成的发展 | 第13-14页 |
·非结构化数据统一访问研究现状 | 第14-16页 |
·索引技术现状 | 第16-17页 |
·研究内容 | 第17-18页 |
·论文组织结构 | 第18-20页 |
第二章 相关技术研究及总体设计 | 第20-31页 |
·数据统一访问技术 | 第20-24页 |
·传统的数据统一访问技术 | 第20-22页 |
·非结构化数据统一访问技术 | 第22-24页 |
·Hadoop 分布式计算框架 | 第24-27页 |
·Hadoop 分布式文件系统 | 第25-26页 |
·MapReduce 并行计算模型 | 第26-27页 |
·Lucene 全文检索工具 | 第27-29页 |
·原型系统总体设计 | 第29-30页 |
·小结 | 第30-31页 |
第三章 异构环境下的Hadoop 调度算法改进 | 第31-44页 |
·异构环境分析 | 第31页 |
·异构环境概述 | 第31页 |
·企业异构环境分析 | 第31页 |
·改进的调度算法 | 第31-41页 |
·推测执行算法 | 第32-34页 |
·Hadoop 调度模式分析 | 第34-35页 |
·改进的调度算法 | 第35-39页 |
·改进算法优缺点 | 第39-41页 |
·调度算法测试 | 第41-42页 |
·测试环境 | 第41-42页 |
·测试结果 | 第42页 |
·小结 | 第42-44页 |
第四章 无训练集的分类索引算法 | 第44-54页 |
·改进的关键词权值公式 | 第44-48页 |
·TF-IDF 算法 | 第45-46页 |
·信息熵 | 第46页 |
·改进的权值算法 | 第46-48页 |
·分类索引的构建 | 第48-53页 |
·无训练集分类算法 | 第48-51页 |
·分类索引库的建立过程 | 第51-53页 |
·小结 | 第53-54页 |
第五章 原型系统的设计与实现 | 第54-69页 |
·原型系统总体设计 | 第54-57页 |
·统一访问方案设计 | 第57-59页 |
·文档解析模块 | 第59-62页 |
·功能描述 | 第59页 |
·实现 | 第59-62页 |
·分类索引构建模块 | 第62-65页 |
·功能描述 | 第62页 |
·实现 | 第62-65页 |
·辅助查询模块 | 第65-68页 |
·功能描述 | 第66页 |
·实现 | 第66-68页 |
·小结 | 第68-69页 |
第六章 测试与分析 | 第69-79页 |
·测试环境 | 第69-72页 |
·环境组成 | 第69-70页 |
·环境配置 | 第70-72页 |
·测试用例 | 第72页 |
·测试过程及结论 | 第72-78页 |
·功能测试 | 第72-74页 |
·分类过程实验 | 第74-76页 |
·对比测试 | 第76-78页 |
·小结 | 第78-79页 |
结束语 | 第79-81页 |
参考文献 | 第81-85页 |
作者简历 攻读硕士学位期间完成的主要工作 | 第85-86页 |
致谢 | 第86页 |