摘要 | 第3-4页 |
Abstract | 第4-5页 |
第1章 绪论 | 第9-15页 |
1.1 概述 | 第9-10页 |
1.2 研究背景和现状 | 第10-12页 |
1.2.1 文本分类的研究背景 | 第10页 |
1.2.2 文本分类的研究现状 | 第10-11页 |
1.2.3 文本分类的应用 | 第11-12页 |
1.3 本文的研究内容及论文结构 | 第12-15页 |
1.3.1 本文的研究内容 | 第12-13页 |
1.3.2 本文的组织结构 | 第13-15页 |
第2章 基本算法理论 | 第15-33页 |
2.1 文本分类的相关理论基础 | 第15-23页 |
2.1.1 文本表示 | 第15-16页 |
2.1.2 中文分词技术 | 第16页 |
2.1.3 特征加权 | 第16页 |
2.1.4 特征选择 | 第16-17页 |
2.1.5 文本分类器 | 第17-21页 |
2.1.6 分类器评价标准 | 第21-23页 |
2.2 KNN 文本分类简介 | 第23-28页 |
2.2.1 KNN 文本分类器的基本原理 | 第24页 |
2.2.2 KNN 算法常用的相似性度量函数 | 第24-26页 |
2.2.4 KNN 文本分类的步骤 | 第26页 |
2.2.5 传统 KNN 算法在高维特征空间和大数据集上的缺点与改进 | 第26-28页 |
2.3 粒子群优化算法(PSO)简介 | 第28-31页 |
2.3.1 PSO 算法的基本流程与流程图 | 第28-29页 |
2.3.2 PSO 算法的描述 | 第29页 |
2.3.3 算法各因素 | 第29-30页 |
2.3.4 算法各参数讨论 | 第30-31页 |
2.4 本章小结 | 第31-33页 |
第3章 自适应特征加权 KNN 文本分类器 | 第33-45页 |
3.1 FWPSOKNN 算法基本原理及框架 | 第33-34页 |
3.2 利用改进的 PSO 算法求解自适应最优归一化特征权值 | 第34-38页 |
3.2.1 特征归一化加权 | 第34-35页 |
3.2.2 加权的优化目标函数 | 第35-36页 |
3.2.3 PSO 算法在求解特征最优权值上的改进 | 第36-37页 |
3.2.4 利用改进的 PSO 算法求解自适应最优归一化特征权值 | 第37-38页 |
3.3 特征约简 | 第38页 |
3.4 特征加权 KNN 文本分类过程 | 第38-39页 |
3.5 FWPSOKNN 算法的流程图 | 第39-40页 |
3.6 实验验证 | 第40-43页 |
3.6.1 实验设计 | 第40页 |
3.6.2 文本分类数据集及分词预处理 | 第40页 |
3.6.3 分类效果比较 | 第40-43页 |
3.7 本章小结 | 第43-45页 |
第4章 自适应样本加权 KNN 文本分类器 | 第45-53页 |
4.1 加权的判别函数 | 第45-46页 |
4.2 利用 PSO 算法自适应求解样本的权值 | 第46-47页 |
4.3 样本约简 | 第47页 |
4.4 样本加权 KNN 文本分类过程 | 第47页 |
4.5 SWPSOKNN 算法的流程图 | 第47-49页 |
4.6 实验验证 | 第49-52页 |
4.6.1 实验环境与设置参数 | 第49页 |
4.6.2 语料库 | 第49-50页 |
4.6.3 分类效果比较与分析 | 第50-52页 |
4.7 本章小结 | 第52-53页 |
第5章 改进型自适应加权 KNN 文本分类器 | 第53-61页 |
5.1 KNN 文本分类算法的局限性 | 第53页 |
5.2 对高维大数据集 KNN 文本分类算法的改进 | 第53-54页 |
5.3 WPSOKNN 文本分类算法 | 第54-55页 |
5.3.1 算法的原理 | 第54页 |
5.3.2 算法步骤及流程图 | 第54-55页 |
5.4 WPSOKNN 文本分类系统的设计与实现 | 第55-59页 |
5.4.1 系统框架图 | 第55-56页 |
5.4.2 系统运行环境 | 第56页 |
5.4.3 系统实现 | 第56-59页 |
5.5 实验验证 | 第59-60页 |
5.6 本章小结 | 第60-61页 |
第6章 总结与展望 | 第61-65页 |
6.1 总结 | 第61-62页 |
6.2 工作创新 | 第62-63页 |
6.3 未来工作 | 第63-65页 |
参考文献 | 第65-69页 |
致谢 | 第69-71页 |
个人简历、在学期间发表的学术论文与研究成果 | 第71-72页 |