首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于SVM的文本分类应用研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-16页
    1.1 研究背景和意义第11-12页
        1.1.1 研究背景第11页
        1.1.2 研究意义第11-12页
    1.2 国内外研究现状第12-15页
        1.2.1 国外研究现状第12-14页
        1.2.2 国内研究现状第14-15页
    1.3 本论文的组织结构第15-16页
第二章 文本分类理论与技术基础第16-32页
    2.1 文本分类方法第16-19页
        2.1.1 词匹配法第16页
        2.1.2 知识工程法第16-17页
        2.1.3 统计学习法第17-19页
            2.1.3.1 感知机第17-18页
            2.1.3.2 k近邻法第18页
            2.1.3.3 最大熵模型第18-19页
            2.1.3.4 其他统计学习法第19页
    2.2 SVM理论第19-28页
        2.2.1 SVM简介第19页
        2.2.2 SVM优势第19-20页
        2.2.3 基本原理第20-24页
            2.2.3.1 线性可分问题第20-22页
            2.2.3.2 线性不可分问题第22-24页
            2.2.3.3 构造用于分类的SVM第24页
        2.2.4 与分类性能相关的参数第24-26页
            2.2.4.1 惩罚参数第25页
            2.2.4.2 核函数第25-26页
        2.2.5 多类分类问题第26-28页
    2.3 SVM模型的求解第28-31页
    2.4 本章小结第31-32页
第三章 SVM文本分类系统分析与设计第32-41页
    3.1 问题定义与可行性研究第32页
    3.2 需求分析与基本流程第32-33页
    3.3 样本预处理流程第33-35页
    3.4 训练与测试流程第35-39页
        3.4.1 训练与测试的整体流程第35-36页
        3.4.2 数据结构与函数接.定义第36-37页
        3.4.3 训练流程的细分第37-38页
        3.4.4 泛化测试流程的细分第38-39页
    3.5 本章小结第39-41页
第四章 基于SVM文本分类方法的优化与改进第41-55页
    4.1 预处理阶段中文本向量化的优化第41-48页
        4.1.1 特征提取方法的改进第41-44页
            4.1.1.1 现有的特征提取方法第41-43页
            4.1.1.2 对开方检验的优化第43-44页
        4.1.2 权值计算方法的改进第44-48页
            4.1.2.1 现有的权值方法TF-IDF第45-46页
            4.1.2.2 结合特征提取的TF-IDF方法改进第46-48页
    4.2 对预处理后样本重新排列的方法设计第48-51页
        4.2.1 预处理后样本集的组织形式第48-49页
        4.2.2 为避免性能损失的样本整理方法的提出和设计第49-51页
    4.3 分类时决策方式的改进第51-53页
        4.3.1 非单一决策(NUD)思想的提出第51页
        4.3.2 各类均不互斥时NUD-SVM分类器构造和决策策略第51-52页
        4.3.3 部分类互斥时NUD-SVM分类器构造和决策策略第52-53页
        4.3.4 NUD-SVM的性能分析第53页
    4.4 本章小结第53-55页
第五章 改进的SVM文本分类系统的实现第55-66页
    5.1 样本获取与存放第55-60页
        5.1.1 通过网络获得已整理的语料库第55页
        5.1.2 利用标记窗算法进行网页正文提取第55-60页
    5.2 文本转码和分词第60-63页
        5.2.1 字符编码介绍及转换第60-62页
        5.2.2 中文分词原理和实现第62-63页
    5.3 样本向量化第63-64页
    5.4 NUD-SVM分类的实现第64-65页
    5.5 本章小结第65-66页
第六章 测试与验证第66-89页
    6.1 测试环境与方式第66页
    6.2 基本的功能测试第66-69页
        6.2.1 样本转码和中文分词第66-67页
        6.2.2 网页正文提取与分类第67-68页
        6.2.3 特征提取与样本向量化第68-69页
        6.2.4 基本的文本分类结果第69页
    6.3 优化的向量化方法性能验证第69-71页
        6.3.1 优化的卡方检验实验结果第69-70页
        6.3.2 改进向量化方法实验结果第70-71页
    6.4 样本重新排列方法验证第71-72页
    6.5 NUD-SVM性能验证第72-88页
        6.5.1 通过实验获得性能最优化的参数第72-86页
            6.5.1.1 分类性能的评价标准第72-74页
            6.5.1.2 核函数的比较与选择第74-81页
            6.5.1.3 惩罚参数对分类性能的影响的研究第81-84页
            6.5.1.4 优化后的SVM与其他分类方法的性能比较第84-86页
        6.5.2 分类性能最优参数下的NU-SVM分类效果验证和比较第86-88页
    6.6 本章小结第88-89页
第七章 总结与展望第89-91页
    7.1 本文总结第89-90页
    7.2 展望第90-91页
致谢第91-92页
参考文献第92-96页

论文共96页,点击 下载论文
上一篇:企业级WEB前端MVC框架设计
下一篇:基于双目视觉的小型无人飞行器的导航与避障