首页--社会科学总论论文--统计学论文--统计方法论文

基于统计方法的中文文本分类

摘要第5-6页
Abstract第6页
第一章 研究概述第9-11页
    1.1 研究背景及意义第9页
    1.2 国内外文本分类的研究进展第9-10页
    1.3 本文的研究方法第10页
    1.4 内容结构安排第10-11页
第二章 分类算法简介第11-24页
    2.1 KNN算法第11-13页
        2.1.1 KNN算法的思想第11-13页
        2.1.2 最近邻分类算法的特征第13页
    2.2 SVM分类算法第13-20页
        2.2.1 SVM理论概述第13页
        2.2.2 最大边缘超平面第13-15页
        2.2.3 线性决策边界第15-16页
        2.2.4 线性分类器的边缘第16页
        2.2.5 学习线性SVM模型第16-17页
        2.2.6 线性支持向量机:不可分情况第17-18页
        2.2.7 非线性支持向量机第18-20页
        2.2.8 支持向量机的特征第20页
    2.3 组合学习分类方法第20-24页
        2.3.1 组合学习的思想第20页
        2.3.2 装袋第20-21页
        2.3.3 提升第21-22页
        2.3.4 随机森林第22-24页
第三章 中文文本的预处理第24-29页
    3.1 中文分词原理的解说第24-26页
        3.1.1 基于理解的分词方法第24页
        3.1.2 基于字符串匹配的分词方法第24-25页
        3.1.3 基于统计的分词方法第25-26页
    3.2 利用R语言进行中文分词第26页
    3.3 文本特征的表示第26-29页
第四章 中文文本分类实例第29-43页
    4.1 数据集的描述第29-30页
    4.2 模型的评估方法第30页
    4.3 模型的训练第30-39页
        4.3.1 KNN分类模型第30-32页
        4.3.2 SVM模型第32-34页
        4.3.3 组合学习方法第34-39页
    4.4 模型的比较与评价第39-42页
    4.5 缺陷与不足第42-43页
第五章 总结第43-44页
参考文献第44-45页
附录第45-54页
致谢第54页

论文共54页,点击 下载论文
上一篇:反垄断法规制不公正交易行为的问题研究
下一篇:高中《化学反应原理》学习难点的测查及教学策略研究