面向大规模文本数据的并行SVM算法的设计与实现

中文摘要	第1-4页
ABSTRACT	第4-6页
目录	第6-9页
第一章绪论	第9-14页
·研究背景及意义	第9-10页
·国内外研究现状	第10-11页
·国内外研究存在的问题	第11-12页
·主要研究内容	第12页
·论文章节组织结构	第12-14页
第二章相关技术综述	第14-32页
·文本挖掘与文本分类	第14-16页
·文本挖掘	第14-16页
·文本分类	第16页
·文本分类预处理技术	第16-23页
·特征抽取	第17-18页
·特征选择	第18-20页
·文本向量表示	第20-23页
·支持向量机文本分类方法	第23-27页
·支持向量机	第23页
·线性可分情况	第23-25页
·线性不可分情况	第25-27页
·Hadoop平台介绍	第27-31页
·技术背景	第27-28页
·Hadoop分布式文件系统HDFS	第28-29页
·Hadoop MapReduce编程模型	第29-30页
·HBase海量数据存储模型	第30-31页
·小结	第31-32页
第三章基于可行性方向法的并行SVM算法	第32-45页
·文本分类算法模型	第32-34页
·建立SVM两类分类模型	第32-33页
·确定分类模型的核函数类型	第33-34页
·建立SVM多类分类模型	第34页
·SVM文本分类算法求解及改进	第34-40页
·基于可行性方向法的SVM算法	第34-37页
·改进的基于可行性方向法的SVM算法	第37-39页
·SVM算法迭代停机准则	第39-40页
·并行SVM学习算法模型	第40-42页
·实验及算法性能分析	第42-44页
·小结	第44-45页
第四章基于Hadoop并行SVM文本分类系统的设计与实现	第45-66页
·文本分类系统总体结构设计	第45-47页
·文本分类系统存储逻辑结构模型设计	第47-49页
·文本数据预处理的设计与实现	第49-55页
·Web文本提取与文本特征提取	第49-50页
·文本特征选择	第50-53页
·文本表示	第53-54页
·改进的特征权重计算	第54-55页
·基于Hadoop的SVM分类训练器的设计与实现	第55-60页
·并行化的SVM	第55-57页
·数据集划分	第57-58页
·迭代停止条件	第58页
·自定义MapReduce任务的实现	第58-60页
·并行化SVM多类分类的设计实现	第60-62页
·实验评估与分析	第62-65页
·分布式集群测试环境	第62页
·测试数据集的获取	第62-63页
·测试评估方面及评估指标	第63-64页
·测试评估结果及分析	第64-65页
·小结	第65-66页
第五章总结与展望	第66-68页
·全文总结	第66-67页
·未来工作展望	第67-68页
参考文献	第68-73页
发表论文和参加科研情况说明	第73-74页
致谢	第74页