摘要 | 第3-4页 |
Abstract | 第4页 |
第一章 绪论 | 第7-15页 |
1.1 研究背景及意义 | 第7-8页 |
1.1.1 研究背景 | 第7页 |
1.1.2 研究意义 | 第7-8页 |
1.2 国内外研究综述 | 第8-13页 |
1.2.1 主动学习算法理论的研究现状 | 第8-12页 |
1.2.2 主动学习算法的应用研究现状 | 第12-13页 |
1.3 研究思路和内容 | 第13-14页 |
1.3.1 研究思路 | 第13页 |
1.3.2 研究内容 | 第13-14页 |
1.4 本文的特色和创新之处 | 第14-15页 |
1.4.1 本文的特色 | 第14页 |
1.4.2 本文的创新之处 | 第14-15页 |
第二章 主动学习算法 | 第15-26页 |
2.1 主动学习的训练样本 | 第15页 |
2.2 以减少不确定性为标准的主动学习算法 | 第15-19页 |
2.2.1 方法简介 | 第15-16页 |
2.2.2 不确定性的概率度量和差异性度量 | 第16-19页 |
2.3 以最大程度缩减变型空间为标准的主动学习算法 | 第19-22页 |
2.3.1 方法简介 | 第19-20页 |
2.3.2 委员会投票法的投票熵 | 第20-21页 |
2.3.3 产生委员会的元算法 | 第21-22页 |
2.4 以最小化泛化误差为标准的主动学习算法 | 第22-26页 |
2.4.1 方法简介 | 第22页 |
2.4.2 分类误差 | 第22-23页 |
2.4.3 误分率贡献 | 第23-26页 |
第三章 结合遗传算法的文本聚类方法研究 | 第26-54页 |
3.1 基于遗传算法的聚类方法存在的问题 | 第26-28页 |
3.1.1 簇代表单一 | 第27页 |
3.1.2 以欧氏距离作为簇划分的依据 | 第27页 |
3.1.3 交叉运算方式随意 | 第27-28页 |
3.1.4 不适用于分布式计算 | 第28页 |
3.1.5 聚类数目设置缺乏弹性 | 第28页 |
3.2 IGAKME算法 | 第28-36页 |
3.2.1 IGAKME算法的整体流程 | 第29-30页 |
3.2.2 个体编码与数据集拆分 | 第30页 |
3.2.3 从子集中产生最优个体 | 第30-33页 |
3.2.4 从种群中产生最优个体 | 第33-35页 |
3.2.5 通过最优个体确定最优聚类数目 | 第35-36页 |
3.3 仿真实验与结果分析 | 第36-54页 |
3.3.1 数据集 | 第36页 |
3.3.2 实验步骤 | 第36-38页 |
3.3.3 实验结果 | 第38-50页 |
3.3.4 实验评价 | 第50-54页 |
第四章 主动学习分类算法研究 | 第54-59页 |
4.1 训练样本集不完整问题的提出 | 第54-55页 |
4.1.1 训练样本特征值缺省 | 第54页 |
4.1.2 训练样本类型不全 | 第54-55页 |
4.1.3 类型标签样本不全 | 第55页 |
4.2 主动学习分类算法框架 | 第55-59页 |
4.2.1 抽取潜在未知样本 | 第55-56页 |
4.2.2 选择模块与专家标记 | 第56-57页 |
4.2.3 基准分类器 | 第57页 |
4.2.4 模型性能评估 | 第57-58页 |
4.2.5 主动学习分类算法流程 | 第58-59页 |
第五章 主动学习算法在文本分类上的应用研究 | 第59-81页 |
5.1 文本分类问题 | 第59-63页 |
5.1.1 文本数据处理的一般过程 | 第59-63页 |
5.1.2 主动学习分类算法框架在文本分类上的应用分析 | 第63页 |
5.2 文本分类算法SVM_(AL-IGAKME) | 第63-71页 |
5.2.1 未知样本的挖掘 | 第64页 |
5.2.2 待标记样本的挖掘 | 第64-65页 |
5.2.3 学习模块 | 第65-68页 |
5.2.4 模型性能评价 | 第68-69页 |
5.2.5 SVM_(AL-IGAKME)的整体流程 | 第69-71页 |
5.3 文本分类仿真实验 | 第71-81页 |
5.3.1 数据集 | 第71-72页 |
5.3.2 实验步骤 | 第72-73页 |
5.3.3 实验过程与结果 | 第73-79页 |
5.3.4 实验结果评价 | 第79-81页 |
研究结论与展望 | 第81-83页 |
参考文献 | 第83-87页 |
致谢 | 第87-88页 |
附录 | 第88-128页 |
个人简介 | 第128页 |
在学期间的研究成果及发表的学术论文 | 第128页 |