首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

基于语义中心的KNN文本分类算法研究

摘要第1-4页
ABSTRACT第4-5页
目录第5-7页
1 绪论第7-13页
   ·基本概念第7-8页
     ·文本分类的定义第7-8页
     ·文本聚类的定义第8页
   ·文本分类和聚类的发展和现状第8-10页
   ·研究工作背景第10-11页
   ·论文的主要研究内容第11-12页
   ·论文结构和安排第12-13页
2 文本表示和特征选择第13-23页
   ·文本表示模型第13-15页
     ·向量空间模型第13-15页
   ·文本预处理第15-16页
     ·字符编码转换第15页
     ·中文文本分词第15-16页
     ·停用词过滤第16页
   ·特征权重计算第16-17页
   ·文本间的相似度计算第17-18页
   ·文本特征选择第18-22页
     ·特征选择对分类的作用第18-19页
     ·特征选择的几种方法第19-22页
   ·小结第22-23页
3 文本分类算法第23-30页
   ·概述第23页
   ·SVM分类算法第23-25页
     ·统计学习理论第23-24页
     ·支持向量机及其分类原理第24-25页
   ·KNN分类算法第25-27页
     ·使用相似度和辅助KNN分类第26页
     ·KNN和SVM的优劣对比第26-27页
   ·文本分类的质量评价第27-29页
     ·宏平均和微平均第27-28页
     ·平衡点(BEP)和F值第28-29页
   ·文本分类的过程第29页
   ·小结第29-30页
4 基于聚类的KNN语义中心构造第30-39页
   ·基于划分的聚类算法第30-31页
     ·K-平均(K-means)算法第30-31页
     ·K-中心点(K-medoids)算法第31页
   ·聚类质量的评价第31-33页
     ·内部评价标准第31-32页
     ·外部评价标准第32-33页
   ·聚类中心点初始化方法的改进第33-35页
   ·K近邻聚类算法的改进第35-37页
   ·基于聚类算法的语义中心构造第37-38页
   ·小结第38-39页
5 实验及在项目中的应用第39-55页
   ·系统结构第39-41页
     ·系统总体结构第39-40页
     ·实验模块中各部分说明第40-41页
   ·实验所用的数据集第41-42页
   ·实验设计与结果分析第42-55页
     ·分类算法部分的实验第43-49页
     ·聚类的相关实验部分第49-53页
     ·构建语义中心第53-55页
6 总结和展望第55-57页
   ·总结第55页
   ·展望第55-57页
致谢第57-58页
参考文献第58-60页

论文共60页,点击 下载论文
上一篇:博客支持下的校本课程资源建设策略研究
下一篇:补充紫外线-B照射对不结球白菜生长与品质及生理特性的影响