首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于支持向量机的海量文本分类并行化技术研究

摘要第5-6页
ABSTRACT第6页
第1章 绪论第10-15页
    1.1 研究背景与意义第10页
    1.2 国内外研究发展现状第10-14页
        1.2.1 文本分类第10-12页
        1.2.2 文本分类并行化第12-13页
        1.2.3 情感分类第13-14页
    1.3 研究的主要内容第14页
    1.4 本文的内容组织第14-15页
第2章 中文文本分类研究第15-29页
    2.1 中文文本分类框架第15-16页
    2.2 中文文本处理流程第16-22页
        2.2.1 中文分词第16-17页
        2.2.2 去停用词第17-18页
        2.2.3 文本向量表示第18页
        2.2.4 特征选择第18-21页
        2.2.5 权重计算第21-22页
    2.3 文本分类算法第22-26页
        2.3.1 K最近邻分类算法第22-23页
        2.3.2 朴素贝叶斯分类算法第23-25页
        2.3.3 支持向量机分类算法第25-26页
    2.4 优化算法第26-29页
        2.4.1 人工智能优化算法第26-27页
        2.4.2 粒子群优化算法第27-29页
第3章 并行化技术研究第29-33页
    3.1 GPU并行计算框架第29页
    3.2 Hadoop分布式计算系统第29-31页
        3.2.1 HDFS分布式文件系统第30页
        3.2.2 Map/Reduce计算模型第30页
        3.2.3 Hive数据仓库第30-31页
    3.3 Spark分布式计算系统第31-33页
        3.3.1 弹性分布式数据集第31页
        3.3.2 Spark工作原理第31-33页
第4章 改进的文本分类及并行化方法第33-46页
    4.1 文本特征空间迭代算法第33-37页
        4.1.1 特征空间优化第33-34页
        4.1.2 扩充词典第34页
        4.1.3 过滤混淆词第34-35页
        4.1.4 迭代优化第35-37页
    4.2 粒子群优化的径向基核SVM第37-38页
    4.3 文本预处理的并行实现第38-40页
    4.4 SVM的GPU并行实现第40-43页
        4.4.1 数据加载第40-41页
        4.4.2 GPU并行化的线性核支持向量机第41-42页
        4.4.3 GPU并行化的径向基核支持向量机第42-43页
    4.5 Hadoop并行化的SVM第43-44页
    4.6 Spark并行化的SVM第44-46页
第5章 数据与实验设计第46-52页
    5.1 实验设计第46页
    5.2 数据采集第46-49页
        5.2.1 新闻数据第46-48页
        5.2.2 微博数据第48-49页
    5.3 页面净化第49-50页
    5.4 数据存取第50页
    5.5 评价指标第50-52页
        5.5.1 并行化加速比第50-51页
        5.5.2 准确率和召回率第51页
        5.5.3 F1分数第51-52页
第6章 实验部署与结果分析第52-64页
    6.1 系统环境部署第52页
    6.2 新闻文本分类第52-60页
        6.2.1 新闻文本特征第52-53页
        6.2.2 新闻文本预处理第53-54页
        6.2.3 并行实验部署第54页
        6.2.4 分类精度效果第54-58页
        6.2.5 运行性能对比第58-60页
    6.3 微博情感分类第60-64页
        6.3.1 微博文本特征第60页
        6.3.2 微博文本预处理第60-61页
        6.3.3 并行实验部署第61页
        6.3.4 分类精度效果第61-62页
        6.3.5 运行性能对比第62-64页
结论第64-66页
参考文献第66-69页
攻读学位期间发表论文与研究成果清单第69-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:网壳结构的概率地震易损性分析
下一篇:近海桥梁上部结构波浪作用研究