首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于云平台的文本特征选择算法研究

致谢第5-6页
摘要第6-7页
abstract第7页
1 绪论第14-19页
    1.1 研究背景与意义第14-15页
    1.2 国内外研究现状第15-16页
        1.2.1 文本特征选择算法研究现状第15-16页
        1.2.2 Hadoop云平台研究现状第16页
    1.3 本文主要研究内容第16-17页
    1.4 各章研究内容与论文结构第17-19页
2 文本分类和Hadoop分布式云平台技术第19-24页
    2.1 文本分类过程第19页
    2.2 文本预处理第19-20页
        2.2.1 中文分词第19页
        2.2.2 去停用词第19-20页
    2.3 文本表示第20-21页
        2.3.1 布尔模型第20页
        2.3.2 概率模型第20-21页
        2.3.3 向量空间模型第21页
    2.4 常用特征提取算法第21-23页
        2.4.1 文档频率(DF)第21页
        2.4.2 信息增益(IG)第21-22页
        2.4.3 互信息(MI)第22页
        2.4.4 卡方统计(CHI)第22-23页
    2.5 常见分类算法第23-24页
        2.5.1 朴素贝叶斯方法第23页
        2.5.2 K最近邻方法第23-24页
3 Hadoop分布式云平台第24-28页
    3.1 Hadoop云平台架构第24页
    3.2 HDFS分布式文件系统第24-25页
        3.2.1 HDFS简介第24-25页
        3.2.2 HDFS系统架构第25页
    3.3 Map Reduce并行编程第25-27页
        3.3.1 Map Reduce并行架构第25-26页
        3.3.2 Map Reduce并行编程接口第26-27页
    3.4 文章小结第27-28页
4 基于CHI和MI的改进型组合特征选择算法CHMI第28-36页
    4.1 引言第28页
    4.2 经典CHI和MI方法的不足第28-29页
    4.3 改进的基于CHI和MI的组合特征提取方法CHMI第29-31页
    4.4 实验与结果分析第31-35页
        4.4.1 测试方法第31页
        4.4.2 语料库说明第31-32页
        4.4.3 评价标准第32页
        4.4.4 实验结果与分析第32-35页
    4.5 本章小结第35-36页
5 基于云平台的并行文本特征选择算法MRCHMI第36-46页
    5.1 引言第36页
    5.2 并行实现文本特征选择分析第36页
    5.3 基于Map Reduce的文本特征选择算法设计第36-41页
    5.4 实验与结果分析第41-45页
        5.4.1 实验环境第41-42页
        5.4.2 评价标准第42页
        5.4.3 实验结果与分析第42-45页
    5.5 本章小结第45-46页
6 结论第46-48页
    6.1 研究总结第46-47页
    6.2 需要进一步开展的工作第47-48页
参考文献第48-53页
作者简历第53页

论文共53页,点击 下载论文
上一篇:对俄汉语教材《新实用汉语课本(第一、第二册)》与《实用汉语教科书(第一册)》对比分析
下一篇:DHL快递在中国市场的发展战略研究