首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

分布式架构下的海量文本特征分类研究

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-14页
    1.1 研究背景第9-10页
    1.2 课题意义和应用第10页
    1.3 国内外研究现状第10-11页
    1.4 主要问题与难点第11-12页
    1.5 论文章节安排第12-14页
第二章 文本分类详述第14-26页
    2.1 文本分类的基本过程第14-18页
        2.1.1 特征提取和文本表示第15-18页
        2.1.2 文本特征选取第18页
    2.2 分类器原理与并行优化第18-25页
        2.2.1 贝叶斯分类器第19-20页
        2.2.2 支持向量机(SVM)第20-21页
        2.2.3 文本情感分类第21-24页
        2.2.4 其他分类方法第24-25页
    2.3 本章小结第25-26页
第三章 分布式架构与平台搭建第26-38页
    3.1 分布式架构简介第26-28页
        3.1.1 Hadoop和MapReduce范式第26-27页
        3.1.2 海量数据的存取第27-28页
    3.2 平台搭建第28-33页
        3.2.1 Hadoop平台软硬件特性第29-30页
        3.2.2 Windows平台管理工具第30-32页
        3.2.3 平台间协同:JSON-RPC第32-33页
    3.3 数据源与数据结构第33-36页
        3.3.1 数据源第33-34页
        3.3.2 数据向量化第34-36页
        3.3.3 分类器接口第36页
    3.4 本章小结第36-38页
第四章 并行算法优化第38-47页
    4.1 文本分类的并行化第38-43页
        4.1.1 短文本的预处理第38-39页
        4.1.2 训练数据的合理划分第39页
        4.1.3 贝叶斯分类器的并行化第39-40页
        4.1.4 SVM分类器的并行化第40-42页
        4.1.5 多分类器的合并问题第42-43页
    4.2 情感分类的设计与优化策略第43-46页
        4.2.1 分词和词性标注第43-44页
        4.2.2 搜索情感词第44-45页
        4.2.3 并行优化第45-46页
    4.3 本章小结第46-47页
第五章 性能测试第47-54页
    5.1 分类性能测试第47-51页
        5.1.1 贝叶斯分类器测试第47-49页
        5.1.2 支持向量机测试第49-51页
    5.2 并行文本情感分类测试第51-53页
    5.3 本章小结第53-54页
第六章 总结与展望第54-57页
    6.1 论文总结第54-55页
    6.2 进一步研究的问题第55-57页
参考文献第57-59页
致谢第59-60页
攻读学位期间发表或已录用的学术论文第60页

论文共60页,点击 下载论文
上一篇:基于财务治理的哈尔滨博实集团盈余质量评价研究
下一篇:网络口碑对网站特性与消费者信任关系的调节作用研究