首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

英文文本自动分类系统研究与算法改进

摘要第1-4页
Abstract第4-5页
目录第5-7页
1 绪论第7-13页
   ·论文研究背景和意义第7-8页
   ·国外研究现状第8-9页
   ·国内研究现状第9-10页
   ·研究内容第10-11页
   ·论文组织第11-13页
2 文本自动分类技术概述第13-23页
   ·文本自动分类的基本概念第13-14页
   ·文本自动分类的发展历程第14页
   ·文本自动分类的一般过程第14-21页
     ·文本预处理第15页
     ·文本表示第15-17页
     ·特征值提取第17-19页
     ·权重计算第19-20页
     ·分类算法第20-21页
   ·评价方法第21页
   ·本章小结第21-23页
3 特征值提取算法的改进第23-30页
   ·概率启发式规则第23-25页
     ·词频启发式规则第23-24页
     ·集中度启发式规则第24页
     ·分散度启发式规则第24页
     ·概率启发式规则第24-25页
   ·语义启发式规则第25-28页
     ·同义启发式规则第25-26页
     ·同源启发式规则第26页
     ·位置启发式规则第26-27页
     ·多义启发式规则第27-28页
   ·基于多重启发式规则的特征值提取算法第28页
   ·本章小结第28-30页
4 权重计算 TF-IDF 算法的改进第30-35页
   ·传统词语权重计算方法的不足第30-32页
     ·特征值频率第30页
     ·反文档频率第30-31页
     ·TF-IDF 方法的不足第31-32页
   ·改进的 TF-IDF 计算方法第32-34页
     ·特征值的类间离散度第32-33页
     ·特征值的不完全分类的词频差异第33页
     ·特征值的类内离散度第33-34页
   ·本章小结第34-35页
5 KNN 邻近算法的改进第35-42页
   ·传统 KNN 邻近算法第35-36页
   ·传统 KNN 邻近算法的优缺点第36-37页
   ·改进型 KNN 分类算法第37-41页
     ·代表样本的概念第37页
     ·改进型代表样本生成策略第37-38页
     ·改进型训练样本算法实现第38-40页
     ·改进的 KNN 邻近算法流程第40-41页
   ·本章小结第41-42页
6 实验结果与分析第42-55页
   ·特征值提取算法的改进实验与分析第42-43页
   ·权重计算 TF-IDF 算法改进的实验与分析第43-52页
     ·实验介绍第43-44页
     ·实验结果及分析第44-52页
   ·KNN 邻近算法的改进实验与分析第52-54页
     ·实验介绍第52-54页
   ·本章小结第54-55页
7 总结与展望第55-57页
   ·总结第55-56页
   ·展望第56-57页
参考文献第57-61页
致谢第61-62页
在读期间公开发表论文(著)及科研情况第62页

论文共62页,点击 下载论文
上一篇:用于60GHz通信的S型左手材料的研究
下一篇:基于簇相合性的文本增量聚类算法研究