首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

KNN文本分类研究

摘要第1-6页
ABSTRACT第6-10页
第1章 绪论第10-16页
   ·课题的研究背景和应用前景第10-11页
   ·国内外研究现状第11-14页
     ·国外研究现状第11-13页
     ·国内研究现状第13-14页
   ·本文研究的内容第14-15页
   ·本文的组织结构第15-16页
第2章 中文文本分类技术简介第16-30页
   ·文本分类的预处理工作第16-23页
     ·中文文本分词技术第16-18页
     ·文本表示模型第18-21页
     ·特征选择和特征加权第21-23页
   ·文本分类算法简介第23-28页
     ·Rocchio 算法第24页
     ·朴素贝叶斯算法第24-25页
     ·KNN 分类算法第25-26页
     ·支持向量机分类算法第26-28页
   ·评价文本分类算法方法第28-29页
   ·本章小结第29-30页
第3章 对TFIDF 加权方案的改进第30-42页
   ·文本特征加权简介第30-31页
   ·传统TFIDF 简介第31-32页
   ·传统TFIDF 缺陷的研究第32-35页
     ·传统TF 函数缺陷第32-34页
     ·传统IDF 函数缺陷第34-35页
   ·改进的TFIDF 加权方案第35-37页
     ·改进的TF 函数第35-36页
     ·改进的IDF 函数第36-37页
   ·新型TFIDF 与主流分类算法的结合第37-41页
     ·新TFIDF 与KNN 分类算法的结合第38-40页
     ·新TFIDF 与SVM 分类算法的结合第40-41页
   ·本章小结第41-42页
第4章 KNN 算法研究与改进第42-56页
   ·KNN 文本分类算法简介第42页
   ·影响KNN 分类算法的因素第42-44页
     ·影响KNN 分类准确率的因素第43-44页
     ·影响KNN 分类速度的因素第44页
   ·KNN 边界问题解决方案第44-50页
     ·已存在的解决方案第44-45页
     ·本文提出的解决方案第45-48页
     ·实际应用与算法实现第48-50页
   ·KNN 训练文本的裁剪方案第50-55页
     ·基本概念第51-52页
     ·类内部样本裁剪方法第52-53页
     ·类内部样本裁剪算法第53-55页
   ·本章小结第55-56页
第5章 实验及分析第56-66页
   ·实验测试环境与数据集第56-57页
     ·实验测试环境第56页
     ·数据集第56-57页
   ·实验设计方案与评估方式第57-58页
     ·改进的TFIDF 实验设计方案第57页
     ·改进的KNN 实验方案第57-58页
     ·评估方式第58页
   ·实验结果及分析第58-65页
     ·改进的TFIDF 实验结果及分析第58-62页
     ·改进的KNN 实验结果及分析第62-65页
   ·本章小结第65-66页
结论第66-68页
参考文献第68-73页
攻读硕士学位期间承担的科研任务与主要成果第73-74页
致谢第74-75页
作者简介第75页

论文共75页,点击 下载论文
上一篇:软件柔点操控难度的度量模型研究
下一篇:基于CloseGraph的图分类算法研究