基于One-class SVM的多球体文本聚类算法研究

摘要	第1-4页
ABSTRACT	第4-9页
1 绪论	第9-14页
·研究背景与研究意义	第9页
·国内外研究现状	第9-12页
·本文的主要工作	第12页
·文章结构	第12-14页
2 文本聚类相关技术	第14-27页
·文本聚类的定义及特点	第14-15页
·文本聚类的定义	第14页
·文本聚类任务的特点	第14-15页
·文本预处理	第15-16页
·文本切分	第15页
·文本分词	第15-16页
·去除停用词	第16页
·文本表示模型	第16-17页
·向量空间模型	第16-17页
·布尔模型	第17页
·概率模型	第17页
·文本特征项权值计算方法	第17-18页
·基于词频方法	第17页
·基于逆文本频率方法	第17-18页
·基于词频乘逆文本频率方法	第18页
·文本特征项降维方法	第18-21页
·基于潜在语义分析方法	第19页
·基于卡方校验方法	第19-20页
·基于信息增益方法	第20-21页
·基于互信息方法	第21页
·常用文本聚类算法	第21-25页
·基于划分的方法	第22页
·基于层次的方法	第22-23页
·基于密度的方法	第23页
·基于网格的方法	第23-24页
·基于模型的方法	第24-25页
·文本聚类效果评价标准	第25-26页
·本章小结	第26-27页
3 One-class SVM 算法的研究	第27-36页
·统计学习理论简介	第27-33页
·统计推理的建立	第27页
·参数推理方法	第27页
·经验风险最小化	第27-28页
·结构风险最小化	第28-29页
·SVM 算法	第29-33页
·One-class SVM 算法	第33-35页
·SVDD 算法	第33-34页
·One-class SVM 算法	第34-35页
·本章小结	第35-36页
4 基于 One-class SVM 的多球体文本聚类	第36-43页
·多球体聚类	第36-37页
·多球体聚类评价函数 KCDBW	第37-40页
·基于 One-class SVM 多球体文本聚类算法	第40-42页
·本章小结	第42-43页
5 实验结果与分析	第43-60页
·实验设计	第43-45页
·实验环境	第43页
·语料库选择	第43-44页
·实验平台设计	第44-45页
·实验实现	第45-51页
·文本预处理模块	第45-47页
·文本表示模块	第47-48页
·文本特征项降维模块	第48页
·多球体文本聚类模块	第48-51页
·聚类结果评价模块	第51页
·实验结果及分析	第51-59页
·两组 2D 人工数据集	第51-55页
·三组 UCI 实际数据集	第55-57页
·搜狗文本数据集	第57-59页
·本章小结	第59-60页
6 总结与展望	第60-62页
·全文总结	第60页
·研究展望	第60-62页
致谢	第62-63页
参考文献	第63-66页
附录	第66页
A. 作者在攻读硕士学位期间发表的论文目录	第66页
B. 作者在攻读硕士学位期间取得的科研成果目录	第66页