| 致谢 | 第1-6页 |
| 摘要 | 第6-7页 |
| ABSTRACT | 第7-10页 |
| 1 绪论 | 第10-18页 |
| ·研究背景 | 第10-11页 |
| ·研究现状 | 第11-15页 |
| ·数据空间研究现状 | 第11-13页 |
| ·信息抽取研究现状 | 第13-14页 |
| ·语义关联研究现状 | 第14-15页 |
| ·分布式存储及并行处理研究现状 | 第15页 |
| ·本文工作 | 第15-16页 |
| ·论文的组织结构 | 第16-18页 |
| 2 相关技术 | 第18-35页 |
| ·数据空间 | 第18-21页 |
| ·数据空间产生的背景 | 第18-19页 |
| ·数据空间的特性 | 第19-20页 |
| ·数据空间未来的发展 | 第20-21页 |
| ·信息抽取 | 第21-26页 |
| ·基本概念 | 第21-23页 |
| ·抽取机理分析 | 第23-24页 |
| ·信息抽取模型 | 第24-26页 |
| ·语义关联及其构建 | 第26-29页 |
| ·关联及其分类 | 第26页 |
| ·语义关联的形式 | 第26-29页 |
| ·基于Hadoop的云计算平台 | 第29-35页 |
| ·Hadoop分布式计算框架 | 第29-32页 |
| ·计算平台 | 第32-35页 |
| 3 个人数据空间管理原型系统PersonalSpace | 第35-39页 |
| ·PersonalSpace系统架构 | 第35-37页 |
| ·系统主要功能 | 第37-39页 |
| 4 信息抽取 | 第39-50页 |
| ·信息资源的种类划分 | 第39-40页 |
| ·抽取算法 | 第40-45页 |
| ·本地磁盘数据源的抽取 | 第40-42页 |
| ·关系数据库数据源的抽取 | 第42页 |
| ·电子邮件数据源的抽取 | 第42-43页 |
| ·浏览器数据源的抽取 | 第43-45页 |
| ·信息抽取应用的API及包 | 第45-46页 |
| ·信息抽取的实现 | 第46-50页 |
| ·环境下信息抽取过程 | 第46-48页 |
| ·抽取的实现 | 第48-50页 |
| 5 语义关联的构建及存储 | 第50-56页 |
| ·语义关联的种类 | 第50页 |
| ·语义关联的构建 | 第50-53页 |
| ·系统预定义语义关联的构建 | 第50-52页 |
| ·用户自定义关联的构建 | 第52-53页 |
| ·语义关联存储模型 | 第53-56页 |
| ·系统预定义关联的存储 | 第53-54页 |
| ·用户自定义关联的存储 | 第54-55页 |
| ·语义关联存储模型分析 | 第55-56页 |
| 6 实验测试及分析 | 第56-68页 |
| ·测试环境 | 第56-57页 |
| ·测试目标 | 第57-58页 |
| ·测试实验 | 第58-64页 |
| ·实验执行过程 | 第58-59页 |
| ·实验结果 | 第59-64页 |
| ·实验结果分析 | 第64-66页 |
| ·基于不同任务粒度的实验结果及分析 | 第66-68页 |
| 7 总结与展望 | 第68-69页 |
| 参考文献 | 第69-72页 |
| 作者简介 | 第72-74页 |
| 学位论文数据集 | 第74页 |