基于概念的文本自动分类研究
中文摘要 | 第1-3页 |
英文摘要 | 第3-4页 |
目录 | 第4-6页 |
第一章 序言 | 第6-8页 |
第二章 系统结构与基础理论 | 第8-25页 |
2.1 基本概念 | 第8-10页 |
2.1.1 文本分类 | 第8-9页 |
2.1.2 训练集和测试集 | 第9-10页 |
2.1.3 文本表示 | 第10页 |
2.2 文本分类的系统结构 | 第10-12页 |
2.3 文本分类的一般方法 | 第12-17页 |
2.3.1 特征子集抽取算法 | 第12-15页 |
2.3.2 训练方法与分类算法 | 第15-17页 |
2.4 《知网》介绍 | 第17-21页 |
2.4.1 知网综述 | 第17-18页 |
2.4.2 知网的概念表示方法 | 第18-21页 |
2.5 概念引入的必要性与方法 | 第21-25页 |
2.5.1 基于关键词文本分类方法的局限性 | 第21-22页 |
2.5.2 引入概念的优势 | 第22-24页 |
2.5.3 义原的分类 | 第24-25页 |
第三章 基于概念的文本分类方法 | 第25-45页 |
3.1 文本表示方法 | 第25-36页 |
3.1.1 文本表示流程 | 第25-26页 |
3.1.2 文本预处理 | 第26-28页 |
3.1.3 关键词提取 | 第28-29页 |
3.1.4 概念排岐 | 第29-34页 |
3.1.5 文本的向量表示 | 第34-36页 |
3.2 文本类别的确定 | 第36-39页 |
3.2.1 两个文本之间的相似度计算 | 第36-37页 |
3.2.2 kNN文本分类方法 | 第37-39页 |
3.3 可分义原的获取 | 第39-40页 |
3.4 可分义原的权值设定方法 | 第40-44页 |
3.4.1 可分义原的权值设定问题描述 | 第41页 |
3.4.2 模拟退火简述 | 第41-43页 |
3.4.3 义原权值设置算法描述 | 第43-44页 |
3.5 小结 | 第44-45页 |
第四章 实验 | 第45-50页 |
4.1 评价参数 | 第45-46页 |
4.2 Reuters-21576测试集介绍 | 第46-47页 |
4.3 实验结果 | 第47-50页 |
结束语 | 第50-52页 |
硕士研究生期间发表的论文 | 第52-53页 |
参考文献 | 第53-56页 |
致谢 | 第56页 |