| 摘要 | 第1-13页 |
| ABSTRACT | 第13-15页 |
| 第一章 绪论 | 第15-27页 |
| ·研究背景 | 第15-19页 |
| ·互联网条件下的内容安全 | 第15-16页 |
| ·内容安全的意义和需求 | 第16-18页 |
| ·面向信息内容安全的文本分类 | 第18-19页 |
| ·文本分类研究现状及挑战 | 第19-23页 |
| ·文本表示 | 第20页 |
| ·表示空间降维 | 第20-21页 |
| ·机器学习分类方法 | 第21页 |
| ·主要技术挑战 | 第21-23页 |
| ·本文的主要研究内容和贡献 | 第23-24页 |
| ·论文结构 | 第24-27页 |
| 第二章 高效率文本分类方法研究 | 第27-51页 |
| ·问题的提出 | 第27-28页 |
| ·高效率SVM多类方法研究 | 第28-39页 |
| ·SVM与多类问题 | 第28-32页 |
| ·基于Rocchio级联的快速SVM多类分类 | 第32-35页 |
| ·类增量式SVM多类方法 | 第35-39页 |
| ·SVM多类方法实验与比较 | 第39-44页 |
| ·数据准备 | 第39-40页 |
| ·实验设置 | 第40页 |
| ·准确性评估指标 | 第40-41页 |
| ·分类准确性比较 | 第41-42页 |
| ·训练和分类时间比较 | 第42-44页 |
| ·实验结论 | 第44页 |
| ·层次式文本分类的Na(l|¨)ve Bayes改进方法 | 第44-48页 |
| ·层次式文本分类 | 第44-45页 |
| ·利用层次特点的Na(l|¨)ve Bayes改进 | 第45-47页 |
| ·实验分析与结论 | 第47-48页 |
| ·本章小结 | 第48-51页 |
| 第三章 自训练与EM集成的半监督学习 | 第51-79页 |
| ·半监督学习 | 第51-55页 |
| ·标注瓶颈与半监督学习 | 第51-53页 |
| ·半监督学习的主要方法 | 第53-54页 |
| ·半监督学习策略分类 | 第54-55页 |
| ·混合参数模型下的EM算法和自训练过程 | 第55-60页 |
| ·文本的混合参数模型 | 第55-56页 |
| ·参数模型的Na(l|¨)ve Bayes学习 | 第56-57页 |
| ·EM算法 | 第57-59页 |
| ·自训练过程 | 第59-60页 |
| ·标注过程对分类器精度的影响 | 第60-63页 |
| ·考虑训练噪声的可学习性 | 第60-61页 |
| ·标注过程提高分类器精度的充分条件 | 第61-63页 |
| ·基于自训练与EM集成的半监督学习 | 第63-71页 |
| ·自训练与EM算法的分析 | 第63-64页 |
| ·自训练与EM集成的基本思想与过程 | 第64-66页 |
| ·ESTM训练算法 | 第66-69页 |
| ·SEMT训练算法 | 第69-70页 |
| ·ESTM与SETM的预测过程 | 第70页 |
| ·ESTM与SETM的简单比较 | 第70-71页 |
| ·实验与分析 | 第71-77页 |
| ·数据准备 | 第71-72页 |
| ·实验设置 | 第72页 |
| ·评估指标 | 第72-73页 |
| ·不同标注比例下的训练效果 | 第73-75页 |
| ·标注和EM步骤的数量分析 | 第75-77页 |
| ·实验结论 | 第77页 |
| ·本章小结 | 第77-79页 |
| 第四章 面向协同训练的特征集分割 | 第79-101页 |
| ·基于特征集分割的协同训练 | 第79-83页 |
| ·协同训练过程 | 第79-81页 |
| ·协同训练的理论依据 | 第81-82页 |
| ·协同训练的进展和问题 | 第82-83页 |
| ·特征与特征集间的独立性度量 | 第83-87页 |
| ·特征之间的独立性 | 第84-85页 |
| ·特征集之间的独立性 | 第85-86页 |
| ·独立性合并保持性质 | 第86-87页 |
| ·局部化策略下的特征集分割 | 第87-95页 |
| ·特征集的局部化假设 | 第87-89页 |
| ·局部化分割策略 | 第89-90页 |
| ·基于文本聚类的特征集分割 | 第90-93页 |
| ·基于特征关联图分块的特征集分割 | 第93-95页 |
| ·实验与比较 | 第95-100页 |
| ·WebKB特征集的分割效果 | 第96-99页 |
| ·TanCorp12特征集的分割效果 | 第99页 |
| ·实验结论 | 第99-100页 |
| ·本章小结 | 第100-101页 |
| 第五章 基于标签状态向量的多标签分类 | 第101-127页 |
| ·多标签学习概述 | 第101-106页 |
| ·多标签学习问题 | 第102-103页 |
| ·多标签学习效果的评价 | 第103-105页 |
| ·多标签学习相关工作 | 第105-106页 |
| ·标签状态向量空间上的多标签学习 | 第106-110页 |
| ·基本思想 | 第106-107页 |
| ·标签状态向量空间 | 第107-109页 |
| ·LSVS上的两阶段学习方法 | 第109-110页 |
| ·基于kNN标签状态向量的Bayes多标签学习 | 第110-114页 |
| ·kNN标签状态向量空间 | 第110页 |
| ·kNN-LSVS上的BOL模型及Bayes学习 | 第110-112页 |
| ·kNN-Bayes的多标签预测 | 第112-114页 |
| ·kNN-LSVS上的改进ML-kNN算法 | 第114-118页 |
| ·ML-kNN方法 | 第114-115页 |
| ·ML-kNN方法的分析 | 第115-117页 |
| ·ML-kNN的一种直接改进 | 第117-118页 |
| ·Na(l|¨)ve Bayes LSVS上的线性最小方差拟合 | 第118-122页 |
| ·Na(l|¨)ve Bayes标签状态向量空间 | 第118-119页 |
| ·NB-LSVS上的LLSF学习 | 第119-122页 |
| ·实验与分析 | 第122-125页 |
| ·实验数据与设置 | 第122-123页 |
| ·实验结果与分析 | 第123-125页 |
| ·实验结论 | 第125页 |
| ·本章小结 | 第125-127页 |
| 结束语 | 第127-129页 |
| 参考文献 | 第129-144页 |
| 致谢 | 第144-145页 |
| 作者在学期间取得的学术成果 | 第145页 |