| 中文摘要 | 第1-4页 |
| 英文摘要 | 第4-8页 |
| 1 绪论 | 第8-12页 |
| ·文本分类的研究背景及意义 | 第8-9页 |
| ·文本分类的研究现状 | 第9-10页 |
| ·本文的研究内容及组织结构 | 第10-12页 |
| 2 文本分类相关技术 | 第12-26页 |
| ·序言 | 第12页 |
| ·文本分类的定义 | 第12-13页 |
| ·文本预处理 | 第13页 |
| ·文本表示模型 | 第13-14页 |
| ·分词、去停用词 | 第14-15页 |
| ·特征降维 | 第15-17页 |
| ·特征选择 | 第15-16页 |
| ·特征抽取 | 第16-17页 |
| ·特征加权 | 第17-18页 |
| ·布尔权重 | 第17页 |
| ·TF 权重 | 第17-18页 |
| ·IDF 权重 | 第18页 |
| ·TF-IDF 权重 | 第18页 |
| ·分类算法 | 第18-23页 |
| ·朴素贝叶斯算法 | 第19页 |
| ·向量空间距离测度分类算法 | 第19页 |
| ·最邻近分类算法 | 第19-20页 |
| ·支持向量机方法 | 第20页 |
| ·决策树分类方法 | 第20-22页 |
| ·类中心分类法 | 第22页 |
| ·组合分类法 | 第22-23页 |
| ·文本分类系统的评价指标 | 第23-25页 |
| ·小结 | 第25-26页 |
| 3 本体概述 | 第26-31页 |
| ·序言 | 第26页 |
| ·本体的定义 | 第26-27页 |
| ·本体的构成 | 第27页 |
| ·本体分类 | 第27-28页 |
| ·HowNet 简介 | 第28-30页 |
| ·小结 | 第30-31页 |
| 4 基于概念映射的二次特征降维方法 | 第31-37页 |
| ·引言 | 第31页 |
| ·特征降维的主要方式及存在的问题 | 第31-32页 |
| ·基于HowNet 构建概念映射表 | 第32-34页 |
| ·基于概念映射的二次特征降维方法 | 第34-35页 |
| ·初次特征降维 | 第34页 |
| ·概念映射 | 第34-35页 |
| ·第二次特征降维 | 第35页 |
| ·改进生成文本向量的方式 | 第35-36页 |
| ·小结 | 第36-37页 |
| 5 实验方法及结果分析 | 第37-46页 |
| ·实验数据 | 第37页 |
| ·文本分类系统 | 第37页 |
| ·实验方案 | 第37-44页 |
| ·构建概念映射表 | 第37-38页 |
| ·“基于概念映射的二次特征降维方法”的处理过程 | 第38-42页 |
| ·在大规模语料库上实验基于概念映射的二次特征降维方法 | 第42-44页 |
| ·实验结果分析 | 第44-46页 |
| 6 总结与展望 | 第46-48页 |
| ·本文总结 | 第46-47页 |
| ·进一步的工作 | 第47-48页 |
| 致谢 | 第48-49页 |
| 参考文献 | 第49-52页 |
| 附录 | 第52页 |
| A 作者在攻读硕士学位期间发表的论文目录 | 第52页 |
| B 作者在攻读硕士学位期间参与的科研项目 | 第52页 |