基于成对约束的半监督文本聚类算法研究

摘要	第1-4页
ABSTRACT	第4-9页
1 绪论	第9-14页
·研究背景与研究意义	第9页
·国内外研究现状	第9-11页
·国外研究现状	第9-11页
·国内研究现状	第11页
·本文的主要工作	第11-12页
·论文的组织结构	第12-14页
2 文本聚类相关技术	第14-25页
·文本聚类的定义及其特点	第14-15页
·文本聚类的定义	第14-15页
·文本聚类任务的特点	第15页
·文本预处理	第15-17页
·文本分词	第16页
·去除停用词	第16-17页
·文本表示模型	第17-18页
·向量空间模型	第17页
·布尔模型	第17-18页
·概率模型	第18页
·文本特征项的权值计算	第18-19页
·词频（TF）方法	第18页
·倒排文档频率（IDF）方法	第18-19页
·TF*IDF 方法	第19页
·文本特征集的缩减	第19-21页
·潜在语义分析	第19-20页
·互信息	第20页
·信息增益	第20页
·χ~2（CHI）统计量	第20-21页
·常用文本聚类算法	第21-23页
·基于划分的方法	第21页
·基于层次的方法	第21-22页
·基于密度的方法	第22页
·基于网格的方法	第22-23页
·基于模型的方法	第23页
·文本聚类效果评价标准	第23-24页
·本章小结	第24-25页
3 半监督聚类算法的研究	第25-37页
·半监督学习	第25-28页
·半监督学习的研究背景	第25-26页
·半监督学习的基本原理	第26-27页
·半监督学习的基本假设	第27-28页
·半监督学习的主要分类	第28页
·半监督聚类	第28-36页
·半监督聚类的定义	第28-29页
·半监督聚类的分类	第29-31页
·半监督聚类的相似性度量	第31-33页
·几种常见的半监督聚类算法	第33-36页
·本章小结	第36-37页
4 基于成对约束的主动半监督文本聚类	第37-45页
·主动学习策略简介	第37页
·主动选取成对约束的方法	第37-40页
·成对约束监督信息的作用	第37-38页
·主动选取成对约束的方法	第38-40页
·基于成对约束的竞争凝聚算法	第40-43页
·竞争凝聚算法简介	第40-41页
·基于成对约束的竞争凝聚算法	第41-43页
·基于成对约束的主动半监督文本聚类方法	第43-44页
·本章小结	第44-45页
5 实验结果与分析	第45-59页
·实验环境介绍及实验平台设计	第45-48页
·实验环境介绍	第45页
·实验平台设计	第45-48页
·文本聚类实验平台的实现	第48-53页
·文本预处理模块	第48-49页
·特征项权值计算模块	第49-50页
·特征集缩减模块	第50页
·成对约束选取与半监督文本聚类模块	第50-52页
·聚类结果评价及输出模块	第52-53页
·实验结果及分析	第53-57页
·语料库介绍	第53页
·实验结果评价标准	第53-54页
·实验结果与分析	第54-57页
·本章小结	第57-59页
6 总结与展望	第59-61页
·总结	第59页
·展望	第59-61页
致谢	第61-62页
参考文献	第62-65页
附录	第65页
A. 作者在攻读学位期间发表的论文目录	第65页
B. 作者在攻读学位期间取得的科研成果目录	第65页