中文摘要 | 第1-4页 |
英文摘要 | 第4-8页 |
1 绪论 | 第8-12页 |
·文本分类的研究背景及意义 | 第8-9页 |
·文本分类的研究现状 | 第9-10页 |
·本文的研究内容及组织结构 | 第10-12页 |
2 文本分类相关技术 | 第12-26页 |
·序言 | 第12页 |
·文本分类的定义 | 第12-13页 |
·文本预处理 | 第13页 |
·文本表示模型 | 第13-14页 |
·分词、去停用词 | 第14-15页 |
·特征降维 | 第15-17页 |
·特征选择 | 第15-16页 |
·特征抽取 | 第16-17页 |
·特征加权 | 第17-18页 |
·布尔权重 | 第17页 |
·TF 权重 | 第17-18页 |
·IDF 权重 | 第18页 |
·TF-IDF 权重 | 第18页 |
·分类算法 | 第18-23页 |
·朴素贝叶斯算法 | 第19页 |
·向量空间距离测度分类算法 | 第19页 |
·最邻近分类算法 | 第19-20页 |
·支持向量机方法 | 第20页 |
·决策树分类方法 | 第20-22页 |
·类中心分类法 | 第22页 |
·组合分类法 | 第22-23页 |
·文本分类系统的评价指标 | 第23-25页 |
·小结 | 第25-26页 |
3 本体概述 | 第26-31页 |
·序言 | 第26页 |
·本体的定义 | 第26-27页 |
·本体的构成 | 第27页 |
·本体分类 | 第27-28页 |
·HowNet 简介 | 第28-30页 |
·小结 | 第30-31页 |
4 基于概念映射的二次特征降维方法 | 第31-37页 |
·引言 | 第31页 |
·特征降维的主要方式及存在的问题 | 第31-32页 |
·基于HowNet 构建概念映射表 | 第32-34页 |
·基于概念映射的二次特征降维方法 | 第34-35页 |
·初次特征降维 | 第34页 |
·概念映射 | 第34-35页 |
·第二次特征降维 | 第35页 |
·改进生成文本向量的方式 | 第35-36页 |
·小结 | 第36-37页 |
5 实验方法及结果分析 | 第37-46页 |
·实验数据 | 第37页 |
·文本分类系统 | 第37页 |
·实验方案 | 第37-44页 |
·构建概念映射表 | 第37-38页 |
·“基于概念映射的二次特征降维方法”的处理过程 | 第38-42页 |
·在大规模语料库上实验基于概念映射的二次特征降维方法 | 第42-44页 |
·实验结果分析 | 第44-46页 |
6 总结与展望 | 第46-48页 |
·本文总结 | 第46-47页 |
·进一步的工作 | 第47-48页 |
致谢 | 第48-49页 |
参考文献 | 第49-52页 |
附录 | 第52页 |
A 作者在攻读硕士学位期间发表的论文目录 | 第52页 |
B 作者在攻读硕士学位期间参与的科研项目 | 第52页 |