摘要 | 第1-13页 |
ABSTRACT | 第13-15页 |
第一章 绪论 | 第15-27页 |
·研究背景 | 第15-19页 |
·互联网条件下的内容安全 | 第15-16页 |
·内容安全的意义和需求 | 第16-18页 |
·面向信息内容安全的文本分类 | 第18-19页 |
·文本分类研究现状及挑战 | 第19-23页 |
·文本表示 | 第20页 |
·表示空间降维 | 第20-21页 |
·机器学习分类方法 | 第21页 |
·主要技术挑战 | 第21-23页 |
·本文的主要研究内容和贡献 | 第23-24页 |
·论文结构 | 第24-27页 |
第二章 高效率文本分类方法研究 | 第27-51页 |
·问题的提出 | 第27-28页 |
·高效率SVM多类方法研究 | 第28-39页 |
·SVM与多类问题 | 第28-32页 |
·基于Rocchio级联的快速SVM多类分类 | 第32-35页 |
·类增量式SVM多类方法 | 第35-39页 |
·SVM多类方法实验与比较 | 第39-44页 |
·数据准备 | 第39-40页 |
·实验设置 | 第40页 |
·准确性评估指标 | 第40-41页 |
·分类准确性比较 | 第41-42页 |
·训练和分类时间比较 | 第42-44页 |
·实验结论 | 第44页 |
·层次式文本分类的Na(l|¨)ve Bayes改进方法 | 第44-48页 |
·层次式文本分类 | 第44-45页 |
·利用层次特点的Na(l|¨)ve Bayes改进 | 第45-47页 |
·实验分析与结论 | 第47-48页 |
·本章小结 | 第48-51页 |
第三章 自训练与EM集成的半监督学习 | 第51-79页 |
·半监督学习 | 第51-55页 |
·标注瓶颈与半监督学习 | 第51-53页 |
·半监督学习的主要方法 | 第53-54页 |
·半监督学习策略分类 | 第54-55页 |
·混合参数模型下的EM算法和自训练过程 | 第55-60页 |
·文本的混合参数模型 | 第55-56页 |
·参数模型的Na(l|¨)ve Bayes学习 | 第56-57页 |
·EM算法 | 第57-59页 |
·自训练过程 | 第59-60页 |
·标注过程对分类器精度的影响 | 第60-63页 |
·考虑训练噪声的可学习性 | 第60-61页 |
·标注过程提高分类器精度的充分条件 | 第61-63页 |
·基于自训练与EM集成的半监督学习 | 第63-71页 |
·自训练与EM算法的分析 | 第63-64页 |
·自训练与EM集成的基本思想与过程 | 第64-66页 |
·ESTM训练算法 | 第66-69页 |
·SEMT训练算法 | 第69-70页 |
·ESTM与SETM的预测过程 | 第70页 |
·ESTM与SETM的简单比较 | 第70-71页 |
·实验与分析 | 第71-77页 |
·数据准备 | 第71-72页 |
·实验设置 | 第72页 |
·评估指标 | 第72-73页 |
·不同标注比例下的训练效果 | 第73-75页 |
·标注和EM步骤的数量分析 | 第75-77页 |
·实验结论 | 第77页 |
·本章小结 | 第77-79页 |
第四章 面向协同训练的特征集分割 | 第79-101页 |
·基于特征集分割的协同训练 | 第79-83页 |
·协同训练过程 | 第79-81页 |
·协同训练的理论依据 | 第81-82页 |
·协同训练的进展和问题 | 第82-83页 |
·特征与特征集间的独立性度量 | 第83-87页 |
·特征之间的独立性 | 第84-85页 |
·特征集之间的独立性 | 第85-86页 |
·独立性合并保持性质 | 第86-87页 |
·局部化策略下的特征集分割 | 第87-95页 |
·特征集的局部化假设 | 第87-89页 |
·局部化分割策略 | 第89-90页 |
·基于文本聚类的特征集分割 | 第90-93页 |
·基于特征关联图分块的特征集分割 | 第93-95页 |
·实验与比较 | 第95-100页 |
·WebKB特征集的分割效果 | 第96-99页 |
·TanCorp12特征集的分割效果 | 第99页 |
·实验结论 | 第99-100页 |
·本章小结 | 第100-101页 |
第五章 基于标签状态向量的多标签分类 | 第101-127页 |
·多标签学习概述 | 第101-106页 |
·多标签学习问题 | 第102-103页 |
·多标签学习效果的评价 | 第103-105页 |
·多标签学习相关工作 | 第105-106页 |
·标签状态向量空间上的多标签学习 | 第106-110页 |
·基本思想 | 第106-107页 |
·标签状态向量空间 | 第107-109页 |
·LSVS上的两阶段学习方法 | 第109-110页 |
·基于kNN标签状态向量的Bayes多标签学习 | 第110-114页 |
·kNN标签状态向量空间 | 第110页 |
·kNN-LSVS上的BOL模型及Bayes学习 | 第110-112页 |
·kNN-Bayes的多标签预测 | 第112-114页 |
·kNN-LSVS上的改进ML-kNN算法 | 第114-118页 |
·ML-kNN方法 | 第114-115页 |
·ML-kNN方法的分析 | 第115-117页 |
·ML-kNN的一种直接改进 | 第117-118页 |
·Na(l|¨)ve Bayes LSVS上的线性最小方差拟合 | 第118-122页 |
·Na(l|¨)ve Bayes标签状态向量空间 | 第118-119页 |
·NB-LSVS上的LLSF学习 | 第119-122页 |
·实验与分析 | 第122-125页 |
·实验数据与设置 | 第122-123页 |
·实验结果与分析 | 第123-125页 |
·实验结论 | 第125页 |
·本章小结 | 第125-127页 |
结束语 | 第127-129页 |
参考文献 | 第129-144页 |
致谢 | 第144-145页 |
作者在学期间取得的学术成果 | 第145页 |