首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

KNN算法的改进及其在自动文本分类中的应用

中文摘要第3-4页
Abstract第4-5页
第一章 引言第8-14页
    1.1 选题的背景和意义第8-10页
    1.2 国内外研究现状第10-12页
    1.3 本文所做的工作第12-13页
    1.4 本文结构第13-14页
第二章 文本自动分类的主要技术第14-29页
    2.1 文本的表示第15-17页
        2.1.1 文本文档的预处理第15-16页
        2.1.2 文本的向量化表示第16-17页
    2.2 特征权重分配第17-19页
        2.2.1 布尔权重第17-18页
        2.2.2 词频权重第18页
        2.2.3 词频逆文档权重第18-19页
    2.3 特征提取第19-23页
        2.3.1 文档频率第19页
        2.3.2 信息增益第19-20页
        2.3.3 互信息第20-21页
        2.3.4 χ~2统计量第21-22页
        2.3.5 期望交叉熵第22-23页
    2.4 常用的文本分类效果评价指标第23-25页
    2.5 常用的文本分类方法第25-28页
        2.5.1 决策树算法第25-26页
        2.5.2 朴素贝叶斯算法第26-27页
        2.5.3 K近邻算法第27页
        2.5.4 支持向量机算法第27页
        2.5.5 人工神经网络算法第27-28页
    2.6 本章小结第28-29页
第三章 传统的KNN算法及学者的研究改进第29-33页
    3.1 传统KNN算法简介第29-30页
    3.2 传统KNN算法的缺点第30页
    3.3 国内外学者对KNN算法的改进第30-32页
    3.4 本章小结第32-33页
第四章 改进的KNN算法一KCKNN第33-39页
    4.1 KCKNN算法思想第33-34页
    4.2 改进算法KCKNN的实现流程第34-37页
        4.2.1 K-means类内聚簇的实现第34-35页
        4.2.2 针对具体待分类样本选择簇组第35页
        4.2.3 利用新样本集进行KNN分类第35-37页
    4.3 实验结果与分析第37-38页
    4.4 本章小结第38-39页
第五章 改进的KNN算法二IWKNN第39-52页
    5.1 IWKNN算法思想第39页
    5.2 基于类别样本数量的改进算法IWKNN1第39-40页
    5.3 基于类别平均距离的改进算法IWKNN2第40-46页
        5.3.1 基于类别平均距离改进算法思想第40-43页
        5.3.2 改进算法的实现流程第43-46页
            5.3.2.1 求类别平均距离第43-45页
            5.3.2.2 利用类别平均距离修正决策函数第45-46页
    5.4 混合改进算法IWKNN第46页
    5.5 实验结果与分析第46-51页
    5.6 本章小结第51-52页
结论和展望第52-53页
参考文献第53-57页
致谢第57-58页
在学期间的研究成果及发表的学术论文第58页

论文共58页,点击 下载论文
上一篇:CBCT图像重建的正则化方法研究
下一篇:基于IOCP的密码管理系统设计与实现