摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第10-15页 |
1.1 研究背景 | 第10-11页 |
1.2 研究现状 | 第11-13页 |
1.2.1 最长公共子序列算法研究现状 | 第11-12页 |
1.2.2 文本相似计算研究现状 | 第12-13页 |
1.2.3 Hadoop平台应用及相关研究 | 第13页 |
1.3 研究内容和论文组织 | 第13-15页 |
第二章 基于Hadoop平台的多序列最长公共子序列并行计算 | 第15-30页 |
2.1 多序列最长公共子序列计算问题 | 第15-16页 |
2.2 最长公共子序列串行算法 | 第16-17页 |
2.3 基于Hadoop分布式架构的多序列最长公共子序列并行算法 | 第17-21页 |
2.3.1 MapReduce中Key/Value的设计 | 第17-19页 |
2.3.2 算法设计与分析 | 第19-21页 |
2.4 实验 | 第21-30页 |
2.4.1 实验环境和数据 | 第21-22页 |
2.4.2 实验结果与分析 | 第22-30页 |
第三章 Hadoop平台上文本相似并行计算 | 第30-45页 |
3.1 文本相似度计算 | 第30-32页 |
3.1.1 文本处理模型 | 第30-31页 |
3.1.2 文本相似度计算方法 | 第31-32页 |
3.2 文本处理与计算模型 | 第32-38页 |
3.2.1 文本预处理 | 第32-36页 |
3.2.2 文本相似度计算算法 | 第36-38页 |
3.3 Hadoop平台上文本相似性计算并行算法 | 第38-40页 |
3.3.1 MapReduce中Key/Value的设计 | 第38-39页 |
3.3.2 算法设计与分析 | 第39-40页 |
3.4 实验 | 第40-45页 |
3.4.1 实验环境及数据 | 第40-41页 |
3.4.2 时间性能评估 | 第41-43页 |
3.4.3 准确性评估 | 第43-45页 |
第四章 总结 | 第45-46页 |
4.1 主要工作成果 | 第45页 |
4.2 未来工作 | 第45-46页 |
参考文献 | 第46-48页 |
致谢 | 第48-50页 |
攻读硕士学位期间参加的科研项目 | 第50页 |