首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于样本重要性原理的KNN文本分类算法

摘要第3-4页
Abstract第4-5页
第一章 引言第8-15页
    1.1 研究的背景与意义第8-9页
    1.2 国内外研究现状第9-12页
    1.3 本文工作和论文结构第12-15页
第二章 文本分类技术第15-26页
    2.1 文档的预处理第15-16页
    2.2 文档的表示模型第16-18页
        2.2.1 布尔模型第16-17页
        2.2.2 向量模型第17-18页
    2.3 特征选择方法第18-20页
        2.3.1 文档频率第19页
        2.3.2 互信息第19页
        2.3.3 信息增益第19页
        2.3.4 卡方检验第19-20页
    2.4 分类算法第20-24页
        2.4.1 K近邻第20-21页
        2.4.2 决策树第21-22页
        2.4.3 支持向量机第22-23页
        2.4.4 集成学习第23-24页
    2.5 分类性能的评价标准第24-26页
        2.5.1 精度和召回率第24页
        2.5.2 F1测度第24-25页
        2.5.3 宏平均F1和微平均F1第25-26页
第三章 样本重要性原理与SI-KNN算法第26-33页
    3.1 样本重要性原理第26-29页
        3.1.1 计算样本的边界值得分第27-29页
        3.1.2 样本的重要性得分第29页
    3.2 KNN算法的研究分析第29-31页
    3.3 SI-KNN算法第31-33页
第四章 实验设计与分析第33-42页
    4.1 实验设计第33-34页
    4.2 实验数据集第34-35页
    4.3 实验结果与分析第35-42页
        4.3.1 近邻K值分析第35-37页
        4.3.2 SI-KNN实验分析第37-39页
        4.3.3 参数敏感性分析第39-42页
第五章 总结与展望第42-45页
    5.1 总结第42-43页
    5.2 未来工作第43-45页
参考文献第45-50页
致谢第50-51页
在读期间公开发表论文(著)及科研情况第51页

论文共51页,点击 下载论文
上一篇:船舱流水孔图像识别方法研究
下一篇:基于Markov图模型的特征哈希算法