首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于N-gram的维吾尔文文本分类研究与系统实现

摘要第3-4页
Abstract第4-5页
目录第6-8页
第一章 序言第8-13页
    1.1 研究背景和意义第8-9页
    1.2 国内外研究状况第9-11页
        1.2.1 文本分类在国外的发展状况第9-10页
        1.2.2 文本分类在国内的发展第10-11页
    1.3 本文的主要研究内容第11页
    1.4 论文结构第11-13页
第二章 文本分类的相关技术第13-29页
    2.1 文本分类的概述第13-14页
    2.2 文本表示第14-18页
        2.2.1 文本表示单元第14-15页
        2.2.2 文本表示模型第15-18页
    2.3 预处理第18-21页
        2.3.1 分词第19页
        2.3.2 非法字符处理第19页
        2.3.3 词干提取第19-20页
        2.3.4 去除停用词第20-21页
    2.4 特征选择第21-23页
        2.4.1 文档频率第21页
        2.4.2 互信息第21-22页
        2.4.3 X2统计量第22页
        2.4.4 信息增益第22-23页
        2.4.5 期望交叉熵第23页
    2.5 特征权重第23-25页
    2.6 分类算法第25-27页
        2.6.1 朴素贝叶斯算法第25页
        2.6.2 支持向量机算法第25-26页
        2.6.3 K 近邻分类算法第26-27页
    2.7 文本分类的评估指标第27-28页
    2.8 本章总结第28-29页
第三章 基于 N-gram 的维吾尔文文本模型第29-38页
    3.1 维吾尔文特点第29-31页
    3.2 N-gram 模型第31-33页
    3.3 N-gram 的优点第33页
    3.4 N-gram 模型关键问题第33-35页
        3.4.1 参数 N 的选择第33-34页
        3.4.2 N-gram 特征的提取过程第34-35页
    3.5 基于 N-gram 频率统计文本分类第35-37页
    3.6 本章小结第37-38页
第四章 基于 N-gram 的维吾尔文文本分类实验及结果分析第38-51页
    4.1 语料库第38-39页
    4.2 实验环境第39页
    4.3 系统特点第39-40页
    4.4 构建每类的 N-gram 特征库模块第40-41页
    4.5 测试模块第41-44页
    4.6 分类性能评价模块第44页
    4.7 实验结果分析第44-51页
第五章 总结与展望第51-52页
    5.1 总结第51页
    5.2 展望第51-52页
参考文献第52-54页
攻读硕士期间发表论文和参加科研情况第54-55页
致谢第55页

论文共55页,点击 下载论文
上一篇:基于.NET分层架构的出租车管理系统的应用与研究
下一篇:基于音视频融合的目标跟踪