首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

维吾尔文文本分类系统的设计与实现

摘要第2-4页
abstract第4-5页
第一章 绪论第8-13页
    1.1 研究背景与意义第8-9页
    1.2 国内外研究现状第9-11页
    1.3 本文主要研究的内容第11页
    1.4 本文的组织结构第11-13页
第二章 文本分类系统的相关技术研究第13-27页
    2.1 文本分类综述第13-14页
        2.1.1 文本分类的定义第13页
        2.1.2 文本分类的流程第13-14页
    2.2 维吾尔文字特点第14-15页
    2.3 文本预处理第15-16页
        2.3.1 文本编码第15页
        2.3.2 除去非法字符第15页
        2.3.3 去停用词第15-16页
        2.3.4 词干提取第16页
    2.4 文本表示第16-19页
        2.4.1 布尔逻辑模型第17页
        2.4.2 向量空间模型第17-18页
        2.4.3 潜在语义索引第18页
        2.4.4 概率模型第18-19页
    2.5 特征选择第19-22页
        2.5.1 文本频率第19-20页
        2.5.2 信息增益第20页
        2.5.3 期望交叉熵第20-21页
        2.5.4 互信息第21页
        2.5.5 卡方统计量第21-22页
    2.6 文本分类算法第22-25页
        2.6.1 朴素贝叶斯分类算法第22-23页
        2.6.2 K-最邻近分类算法第23页
        2.6.3 支持向量机分类算法第23-25页
    2.7 文本分类性能评估第25-26页
        2.7.1 评价方法第25页
        2.7.2 评估标准第25-26页
    2.8 本章小结第26-27页
第三章 改进互信息的维吾尔文特征选择方法第27-35页
    3.1 传统互信息算法第27页
    3.2 传统互信息的不足与改进第27-31页
        3.2.1 互信息算法分析第27-28页
        3.2.2 类别内特征频率第28-29页
        3.2.3 类内分散度第29页
        3.2.4 修正因子第29-30页
        3.2.5 信息增益第30-31页
    3.3 实验结果与分析第31-32页
        3.3.1 实验数据集第31-32页
        3.3.2 分类器第32页
    3.4 实验数据和分析第32-34页
    3.5 本章小结第34-35页
第四章 改进森林优化的维吾尔文特征选择方法第35-45页
    4.1 优化算法在文本特征提取的应用第35-36页
    4.2 森林优化算法的预处理第36-39页
        4.2.1 期望交叉熵第36-37页
        4.2.2 文本频率改进第37页
        4.2.3 特征项区分度的改进第37-38页
        4.2.4 类词频的改进第38页
        4.2.5 数据集不均匀的改进第38-39页
    4.3 期望交叉熵粗提取第39页
    4.4 森林优化基本原理第39-40页
    4.5 改进的森林优化算法第40-42页
    4.6 实验结果第42-44页
    4.7 本章总结第44-45页
第五章 维吾尔文文本分类系统的设计与实现第45-56页
    5.1 系统需求及可行性分析第45-46页
        5.1.1 系统需求性分析第45页
        5.1.2 系统可行性分析第45-46页
    5.2 系统开发环境第46页
    5.3 系统的详细设计与实现第46-54页
        5.3.1 登陆模块设计第47-48页
        5.3.2 预处理模块第48-51页
        5.3.3 特征提取模块第51-54页
        5.3.4 性能评估模块第54页
    5.4 本章小结第54-56页
第六章 总结与展望第56-58页
    6.1 总结第56-57页
    6.2 本文的不足之处第57-58页
参考文献第58-61页
致谢第61-63页

论文共63页,点击 下载论文
上一篇:基于联合特征和K-means结构化稀疏表示的超分辨率重建
下一篇:卷积神经网络在家具图像检索中的应用