第一章 引言 | 第1-9页 |
1.1 研究背景 | 第6-7页 |
1.2 本文工作与论文组织 | 第7-9页 |
第二章 文本分类方法综述 | 第9-30页 |
2.1 文本的表示 | 第9-10页 |
2.2 项的权值 | 第10-11页 |
2.3 维数约简 | 第11-22页 |
2.3.1 特征选择 | 第11-15页 |
2.3.2 特征提取 | 第15-22页 |
2.4 文本分类算法 | 第22-24页 |
2.4.1 基于概念的文本分类法 | 第22页 |
2.4.2 K-NN分类法 | 第22-23页 |
2.4.3 贝叶斯分类方法 | 第23页 |
2.4.4 基于语义网络的概念推理网分类方法 | 第23-24页 |
2.5 文本聚类算法 | 第24-27页 |
2.5.1 层次聚类算法 | 第24-25页 |
2.5.2 分割聚类算法 | 第25页 |
2.5.3 基于密度的聚类算法 | 第25-26页 |
2.5.4 基于网格聚类算法 | 第26页 |
2.5.5 其他聚类算法 | 第26-27页 |
2.6 新的文本分类方法简介——规则空间方法 | 第27页 |
2.7 评价方法 | 第27-30页 |
第三章 项目反应理论(IRT)简介及其参数估计方法 | 第30-50页 |
3.1 项目反应理论简介 | 第30-31页 |
3.2 项目反应模型的优良特性 | 第31页 |
3.3 参数估计方法综述 | 第31-39页 |
3.3.1 条件极大似然估计 | 第31-34页 |
3.3.2 联合极大似然估计 | 第34-35页 |
3.3.3 边际极大似然估计(MMLE)与MMLE/EM算法 | 第35-38页 |
3.3.4 边际贝叶斯估计 | 第38-39页 |
3.4 最小化x~2/EM参数估计方法 | 第39-50页 |
3.4.1 最小化x~2准则参数估计方法 | 第39-40页 |
3.4.2 最小化x~2/EM估计算法 | 第40-44页 |
3.4.3 最小化x~2/EM实验效果和结论 | 第44-50页 |
第四章 规则空间简介 | 第50-53页 |
4.1 ZETA(ζ)的定义和语义 | 第50-51页 |
4.2 规则空间方法 | 第51-53页 |
第五章 IRT和规则空间方法在文本分类中的应用及实验 | 第53-58页 |
5.1 文本集 | 第53页 |
5.2 特征提取 | 第53-54页 |
5.2.1 预处理 | 第53-54页 |
5.2.2 特征提取 | 第54页 |
5.3 分类模型的建立与测试 | 第54-55页 |
5.4 实验结果与结论 | 第55-58页 |
第六章 总结与展望 | 第58-59页 |
参考文献 | 第59-62页 |
致谢 | 第62-63页 |