首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

大数据文本信息分类方法研究与实现

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-18页
    1.1 课题来源第9页
    1.2 课题研究背景、目的及意义第9-11页
    1.3 国内外研究现状第11-15页
    1.4 本文的主要研究工作及结构第15-18页
        1.4.1 本文研究的主要内容第15-16页
        1.4.2 本文结构安排第16-18页
第2章 大数据中文文本分类系统设计第18-36页
    2.1 问题描述第18-19页
    2.2 中文文本分类系统总体架构第19-20页
    2.3 文本分类关键技术第20-35页
        2.3.1 文本预处理技术第20-23页
        2.3.2 特征选择方法第23-25页
        2.3.3 文本表示模型第25-26页
        2.3.4 文本分类方法第26-34页
        2.3.5 分类性能评估准则第34-35页
    2.4 本章小结第35-36页
第3章 面向大数据文本特征选择方法研究第36-47页
    3.1 基于文档频率和词频结合的HBM方法第37-39页
    3.2 基于改进CHI和HBM方法结合的特征选择方法第39-46页
        3.2.1 经典CHI方法存在的问题第39-40页
        3.2.2 目前CHI方法改进方向第40-41页
        3.2.3 基于词频和类别分布的改进CHI方法第41-46页
    3.3 本章小结第46-47页
第4章 系统实现及算法性能测试分析第47-63页
    4.1 系统实现第47-54页
        4.1.1 系统开发环境第47页
        4.1.2 预处理模块第47-49页
        4.1.3 特征选择模块第49-50页
        4.1.4 文本表示模块第50-51页
        4.1.5 训练分类器模块第51-54页
        4.1.6 测试模块第54页
    4.2 算法性能测试分析第54-62页
        4.2.1 基于复旦语料集的测试结果及分析第54-59页
        4.2.2 通信企业政策法规类新闻分类测试分析第59-62页
    4.3 本章小结第62-63页
第5章 总结与展望第63-65页
    5.1 本文工作总结第63-64页
    5.2 后续工作展望第64-65页
致谢第65-66页
参考文献第66-69页

论文共69页,点击 下载论文
上一篇:基于UML的历史建模语言及建模方法研究
下一篇:基于暗通道理论的视频图像去雾算法的研究