首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

KNN文本分类算法的研究

摘要第3-4页
Abstract第4页
1 绪论第8-12页
    1.1 课题研究背景及意义第8-9页
    1.2 国内外现状第9-10页
    1.3 本文的主要工作第10-11页
    1.4 论文结构第11-12页
2 文本分类相关技术介绍第12-26页
    2.1 文本分类过程第12-13页
        2.1.1 文本分类流程和介绍第12-13页
        2.1.2 文本预处理第13页
    2.2 特征选择第13-17页
        2.2.1 特征选择算法第14-16页
        2.2.2 特征加权算法第16-17页
    2.3 文本表示模型第17-18页
        2.3.1 布尔模型第17页
        2.3.2 向量空间模型(Vector Space Model,VSM)第17-18页
    2.4 相似度的计算第18-19页
        2.4.1 欧氏距离第18页
        2.4.2 余弦相似度第18页
        2.4.3 欧式距离和余弦相似度的区别第18-19页
    2.5 常用的文本分类算法第19-23页
        2.5.1 支持向量机分类第19-21页
        2.5.2 决策树分类第21页
        2.5.3 朴素贝叶斯分类第21-22页
        2.5.4 KNN分类第22-23页
    2.6 分类性能的评估第23-25页
    2.7 本章小结第25-26页
3 改进的KNN文本分类算法第26-40页
    3.1 TF-IDF特征加权算法第26-27页
    3.2 经典的KNN算法第27-31页
    3.3 类平均相似度计算方法第31页
    3.4 改进的KNN算法-M算子算法第31-34页
        3.4.1 改进的思想和策略第31页
        3.4.2 M算子算法的思想和步骤第31-33页
        3.4.3 M算子算法与经典的KNN算法性能分析第33-34页
        3.4.4 M算子算法的优点第34页
    3.5 实验结果与分析第34-38页
    3.6 本章小结第38-40页
4 基于标志样本改进的KNN算法第40-52页
    4.1 标志样本的概念第40-41页
    4.2 类中心法样本生成策略第41-42页
    4.3 改进的KNN分类算法第42-46页
        4.3.1 改进的标志样本生成策略第42-44页
        4.3.2 改进的标志样本生成策略的实现第44-45页
        4.3.3 改进的KNN分类算法流程第45-46页
    4.4 实验验证第46-51页
        4.4.1 算法的评估方法第47页
        4.4.2 实验结果第47-51页
    4.5 本章小结第51-52页
5 总结与展望第52-54页
    5.1 本文工作第52页
    5.2 工作展望第52-54页
致谢第54-56页
参考文献第56-59页

论文共59页,点击 下载论文
上一篇:C语言在线考试系统开发及关键技术的研究
下一篇:快恢复功率二极管的结构设计及特性、工艺研究