首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

KNN算法的改进及其在文本分类中的应用

摘要第1-4页
ABSTRACT第4-8页
第一章 绪论第8-13页
   ·课题研究背景及意义第8-9页
   ·国内外研究现状第9-11页
   ·本文所做的工作第11-12页
   ·本文的组织结构第12-13页
第二章 文本分类关键技术研究第13-20页
   ·文本表示方法第13-14页
   ·中文分词技术第14-15页
   ·停用词处理技术第15-16页
   ·特征选择方法第16-18页
     ·文档频率第16-17页
     ·互信息第17页
     ·信息增益第17页
     ·X~2 统计(CHI)第17-18页
   ·特征权重计算方法第18-20页
     ·布尔权重第18页
     ·TF 权重第18页
     ·IDF 权重第18-19页
     ·TFIDF 权重第19-20页
第三章 文本分类算法研究第20-26页
   ·朴素贝叶斯算法第20页
   ·类中心向量法第20-21页
   ·KNN 算法第21-22页
   ·支持向量机第22-23页
   ·神经网络算法第23-24页
   ·决策树算法第24页
   ·分类性能评价指标第24-25页
   ·各分类算法比较第25-26页
第四章 基于向量投影的KNN 文本分类算法第26-34页
   ·KNN 算法研究现状第26-27页
   ·基于向量投影的KNN 算法思想第27-31页
     ·投影寻踪理论第27-28页
     ·iDistance 降维方法第28-29页
     ·基于向量投影的样本裁剪第29-31页
   ·实验结果及分析第31-33页
   ·本章小结第33-34页
第五章 文本分类系统的设计与功能第34-44页
   ·系统体系结构第34-37页
     ·传统KNN 分类系统第34页
     ·基于PKNN 算法的改进文本分类系统第34-37页
   ·各模块设计及功能第37-43页
     ·训练模块设计及功能第37-39页
     ·分类模块设计及功能第39-42页
     ·评价模块设计第42-43页
   ·系统的特点第43页
   ·本章小结第43-44页
第六章 实验及结果分析第44-50页
   ·实验数据集介绍第44页
   ·实验结果第44-49页
     ·CHI 和DF 对分类效果的对照实验第44-47页
     ·特征维数对分类性能的影响第47页
     ·K 值选取对分类性能的影响第47页
     ·PKNN 与 KNN 分类性能对比测试第47-49页
   ·本章小结第49-50页
第七章 总结和展望第50-52页
   ·总结第50页
   ·进一步的工作第50-52页
致谢第52-53页
参考文献第53-56页
附录:作者在攻读硕士学位期间发表的论文第56页

论文共56页,点击 下载论文
上一篇:蛋白质空间结构的相似性比较
下一篇:隐私保护数据挖掘算法的研究