首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

K-近邻中文文本分类方法的研究

摘要第1-6页
Abstract第6-7页
致谢第7-11页
第一章 绪论第11-18页
   ·课题的研究背景和意义第11页
   ·文本分类的基本概念第11-15页
     ·数据挖掘及文本挖掘的概念第11-13页
     ·文本分类的定义第13-15页
     ·文本分类算法的类型第15页
   ·文本分类的发展和研究现状第15-16页
   ·本文组织和安排第16-18页
第二章 KNN 中文文本自动分类技术第18-26页
   ·中文文本分类技术的一般过程第18-19页
   ·特征选取算法第19-21页
     ·文档频率第19页
     ·信息增益第19-20页
     ·互信息第20页
     ·χ~2 检验第20-21页
   ·分类算法第21-24页
   ·质量评估方法第24-25页
   ·本章小结第25-26页
第三章 K-KNN :基于中心文档的KNN 中文文本分类算法第26-38页
   ·引言第26页
   ·文本表示与相似度的相关概念第26-29页
     ·向量空间模型第27-28页
     ·相似度计算第28-29页
   ·基于知网的词语相似度第29-31页
     ·词语相似度与距离第29页
     ·知网及词语相似度计算第29-31页
   ·K-KNN:基于中心文档的knn 分类第31-35页
     ·聚类中心文档第31-32页
     ·文档间相似度计算第32-34页
     ·算法描述第34-35页
   ·实验结果与分析第35-37页
   ·本章小结第37-38页
第四章 基于KNN 训练样本集不均衡的一种处理方法第38-45页
   ·引言第38页
   ·训练样本集不均对分类结果的影响第38-40页
   ·基于较小K 值分类相交类别文本算法第40-42页
     ·算法有效性分析第41页
     ·边界文本及其判定方法第41页
     ·算法描述第41-42页
   ·实验结果与分析第42-43页
   ·本章小结第43-45页
第五章 总结与展望第45-46页
   ·本文主要工作总结第45页
   ·进一步的研究工作第45-46页
参考文献第46-49页
攻读硕士学位期间发表的学术论文第49-50页

论文共50页,点击 下载论文
上一篇:Retinex理论及其在压缩域图像增强中的应用研究
下一篇:企业运营信息化管理系统的设计与开发