大规模文本分类的若干问题研究
摘要 | 第1-7页 |
ABSTRACT | 第7-16页 |
第一章 绪论 | 第16-26页 |
·研究背景和意义 | 第16-17页 |
·文本分类的概念 | 第17-18页 |
·文本自动分类算法 | 第18-23页 |
·有监督分类算法 | 第18-21页 |
·无监督聚类算法 | 第21-22页 |
·国内的研究现状 | 第22-23页 |
·本论文的选题和研究内容 | 第23-24页 |
·本文的组织结构 | 第24-26页 |
第二章 文本的表示 | 第26-39页 |
·向量空间模型 | 第26页 |
·特征的定义及其度量 | 第26-29页 |
·文本特征的定义 | 第26-27页 |
·文本特征的度量 | 第27-29页 |
·特征度量的经验研究 | 第29-37页 |
·Zipf 律及特征的判别能力度量 | 第29-30页 |
·实验数据集 | 第30-31页 |
·统计结果与经验分析 | 第31-37页 |
·小结 | 第37-39页 |
第三章 基于层次语法短语的文本表示研究 | 第39-47页 |
·短语表示的研究进展 | 第39-41页 |
·层次语法短语表示 | 第41-42页 |
·基本概念 | 第41页 |
·层次语法短语的构造 | 第41-42页 |
·文本分类实验 | 第42-43页 |
·实验结果分析 | 第43-45页 |
·小结 | 第45-47页 |
第四章 利用共指语义改进文本表示的研究 | 第47-58页 |
·共指关系分析 | 第47-48页 |
·基于共指语义的 BOW 文本表示 | 第48-51页 |
·BoW 文本表示 | 第48-49页 |
·共指语义的引入 | 第49-51页 |
·文本分类实验设计 | 第51-52页 |
·实验结果及分析 | 第52-57页 |
·小结 | 第57-58页 |
第五章 SVM 原理与分解优化算法 | 第58-76页 |
·支持向量机 | 第58-61页 |
·结构化经验风险原则 | 第58-60页 |
·支持向量机 | 第60-61页 |
·支持向量机的分解优化算法 | 第61-63页 |
·三层分解优化方法 | 第63-75页 |
·经典 SVM 的分解算法及其渐近性质 | 第64-66页 |
·基于三层混合工作集选择的分解算法 | 第66-68页 |
·THWSSF 的实现问题 | 第68-70页 |
·算法 THWSSF 的实现实例 | 第70页 |
·实验结果与分析 | 第70-75页 |
·小结 | 第75-76页 |
第六章 大规模 SVM 的两阶段训练 | 第76-91页 |
·大规模 SVM 训练的研究进展 | 第76-82页 |
·核矩阵预处理 | 第76-78页 |
·近似聚类 | 第78页 |
·随机化 | 第78-80页 |
·解的稀疏性控制 | 第80-82页 |
·简单核集上的支持向量机 | 第82-90页 |
·非平行平面支持向量机 | 第82-83页 |
·平面拟合模型及其核集 coreset | 第83-84页 |
·基于平面拟合的 SVM 训练算法 | 第84-86页 |
·实验结果 | 第86-90页 |
·小结 | 第90-91页 |
第七章 基于双平面拟合的支持向量机 | 第91-103页 |
·平面拟合新模型 | 第91-94页 |
·平面拟合模型 | 第91-93页 |
·新模型与 CCMEB 问题的等价性 | 第93-94页 |
·基于拟合平面的 SVM 训练算法 | 第94-96页 |
·拟合平面的核集 | 第94-95页 |
·SVM 分类器的训练 | 第95-96页 |
·算法 CPSVM 的分析 | 第96-97页 |
·实验结果 | 第97-101页 |
·小结 | 第101-103页 |
第八章 双平面拟合支持向量机的新变体 | 第103-115页 |
·平面拟合的新模型 | 第103-106页 |
·平面拟合模型 | 第103-105页 |
·与最小包球问题的等价性 | 第105-106页 |
·基于平面拟合模型新变体的 SVM 训练 | 第106-108页 |
·拟合平面的核集 coreset | 第106-107页 |
·基于拟合平面核集的 SVM 分类器训练 | 第107-108页 |
·算法 NCPSVM 的分析 | 第108-109页 |
·实验结果 | 第109-114页 |
·小结 | 第114-115页 |
第九章 总结与展望 | 第115-118页 |
·文本表示 | 第115-116页 |
·SVM 训练 | 第116-117页 |
·应用与展望 | 第117-118页 |
致谢 | 第118-119页 |
参考文献 | 第119-129页 |
附录 | 第129-139页 |
攻博期间取得的研究成果 | 第139-141页 |