摘要 | 第5-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第10-18页 |
1.1 研究背景与意义 | 第10-11页 |
1.2 本课题的研究进展 | 第11-17页 |
1.2.1 计算应用研究现状 | 第11-12页 |
1.2.2 邮件挖掘研究现状 | 第12-14页 |
1.2.3 文本挖掘 | 第14-17页 |
1.3 本文主要研究内容 | 第17-18页 |
第二章 系统的需求分析与总体架构 | 第18-32页 |
2.1 基于通信关系及内容的邮件挖掘系统的需求分析 | 第18-20页 |
2.1.1 功能需求 | 第18-20页 |
2.1.2 性能指标 | 第20页 |
2.2 基于通信关系及内容的邮件挖掘系统的总体设计 | 第20-30页 |
2.2.1 设计原则 | 第20-21页 |
2.2.2 系统结构 | 第21-22页 |
2.2.3 系统工作原理 | 第22-23页 |
2.2.4 系统模块 | 第23-30页 |
2.3 部署环境设计 | 第30-31页 |
2.4 本章小结 | 第31-32页 |
第三章 系统关键模块的详细设计与实现 | 第32-52页 |
3.1 虚拟化基础设施建设 | 第32-34页 |
3.2 数据预处理模块设计与实现 | 第34-36页 |
3.2.1 数据预处理模块设计需求 | 第34页 |
3.2.2 数据预处理模块设计方案 | 第34-35页 |
3.2.3 数据预处理模块实现 | 第35-36页 |
3.3 分布式存储与计算环境 | 第36-42页 |
3.3.1 HDFS分布式存储 | 第38-40页 |
3.3.2 Map/Reduce分布式计算模型 | 第40-41页 |
3.3.3 环境搭建 | 第41-42页 |
3.4 并行数据挖掘处理服务集 | 第42-48页 |
3.4.1 并行文本向量建立 | 第43页 |
3.4.2 并行通联关系生成 | 第43页 |
3.4.3 并行通联关系分析 | 第43-45页 |
3.4.4 并行文本聚类 | 第45-47页 |
3.4.5 并行内容相似度计算 | 第47-48页 |
3.5 应用层的设计与实现 | 第48-51页 |
3.5.1 应用层的设计需求 | 第48页 |
3.5.2 应用层的设计方案 | 第48-49页 |
3.5.3 应用层的具体实现 | 第49-51页 |
3.6 本章小结 | 第51-52页 |
第四章 系统的测试与分析 | 第52-58页 |
4.1 系统运行环境 | 第52-53页 |
4.2 系统功能测试 | 第53-54页 |
4.3 系统性能测试与分析 | 第54-57页 |
4.4 本章小结 | 第57-58页 |
第五章 结论与展望 | 第58-60页 |
5.1 论文工作总结 | 第58页 |
5.2 未来工作展望 | 第58-60页 |
参考文献 | 第60-62页 |
致谢 | 第62-64页 |
个人简介 | 第64页 |