基于Hadoop的类案模型设计与实现

摘要	第2-3页
Abstract	第3页
1 绪论	第6-19页
1.1 课题研究背景及意义	第6-8页
1.2 国内外研究现状	第8-16页
1.2.1 国内研究现状	第8-15页
1.2.2 国外研究现状	第15-16页
1.2.3 国内外研究现状解析	第16页
1.3 研究内容与组织结构	第16-19页
2 基于Hadoop的类案模型构建方法	第19-27页
2.1 引言	第19页
2.2 Hadoop概述	第19-23页
2.2.1 Hadoop简述	第19-20页
2.2.2 分布式文件系统-HDFS	第20-21页
2.2.3 分布式编程模型MapReduce	第21-23页
2.3 特征值选择	第23页
2.4 构建类案模型的聚类算法	第23-26页
2.4.1 类案模型概述	第24页
2.4.2 WEKA概述	第24页
2.4.3 K-Means算法	第24-25页
2.4.4 DBSCAN算法	第25页
2.4.5 最大期望算法-EM	第25-26页
2.5 本章小结	第26-27页
3 基于Hadoop的类案模型数据预处理	第27-33页
3.1 引言	第27-28页
3.2 建模数据选择	第28-29页
3.3 数据抽取转换	第29页
3.4 文书实体识别	第29-31页
3.5 数据融合处理	第31-32页
3.6 本章小结	第32-33页
4 类案模型的特征值处理	第33-38页
4.1 引言	第33页
4.2 初始特征值选择	第33-34页
4.3 特征值提取及处理	第34-36页
4.4 主成分分析PCA降维	第36-37页
4.5 本章小结	第37-38页
5 类案模型的设计与实现	第38-45页
5.1 引言	第38页
5.2 类案模型的设计	第38-40页
5.3 基于WEKA的类案模型实现	第40-42页
5.4 类案模型相似度计算的实现	第42-43页
5.5 案件相似度计算实验结果与分析	第43页
5.6 本章小结	第43-45页
结论	第45-46页
参考文献	第46-48页
致谢	第48-50页