首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于成对约束的半监督文本聚类算法研究

摘要第1-4页
ABSTRACT第4-9页
1 绪论第9-14页
   ·研究背景与研究意义第9页
   ·国内外研究现状第9-11页
     ·国外研究现状第9-11页
     ·国内研究现状第11页
   ·本文的主要工作第11-12页
   ·论文的组织结构第12-14页
2 文本聚类相关技术第14-25页
   ·文本聚类的定义及其特点第14-15页
     ·文本聚类的定义第14-15页
     ·文本聚类任务的特点第15页
   ·文本预处理第15-17页
     ·文本分词第16页
     ·去除停用词第16-17页
   ·文本表示模型第17-18页
     ·向量空间模型第17页
     ·布尔模型第17-18页
     ·概率模型第18页
   ·文本特征项的权值计算第18-19页
     ·词频(TF)方法第18页
     ·倒排文档频率(IDF)方法第18-19页
     ·TF*IDF 方法第19页
   ·文本特征集的缩减第19-21页
     ·潜在语义分析第19-20页
     ·互信息第20页
     ·信息增益第20页
     ·χ~2(CHI)统计量第20-21页
   ·常用文本聚类算法第21-23页
     ·基于划分的方法第21页
     ·基于层次的方法第21-22页
     ·基于密度的方法第22页
     ·基于网格的方法第22-23页
     ·基于模型的方法第23页
   ·文本聚类效果评价标准第23-24页
   ·本章小结第24-25页
3 半监督聚类算法的研究第25-37页
   ·半监督学习第25-28页
     ·半监督学习的研究背景第25-26页
     ·半监督学习的基本原理第26-27页
     ·半监督学习的基本假设第27-28页
     ·半监督学习的主要分类第28页
   ·半监督聚类第28-36页
     ·半监督聚类的定义第28-29页
     ·半监督聚类的分类第29-31页
     ·半监督聚类的相似性度量第31-33页
     ·几种常见的半监督聚类算法第33-36页
   ·本章小结第36-37页
4 基于成对约束的主动半监督文本聚类第37-45页
   ·主动学习策略简介第37页
   ·主动选取成对约束的方法第37-40页
     ·成对约束监督信息的作用第37-38页
     ·主动选取成对约束的方法第38-40页
   ·基于成对约束的竞争凝聚算法第40-43页
     ·竞争凝聚算法简介第40-41页
     ·基于成对约束的竞争凝聚算法第41-43页
   ·基于成对约束的主动半监督文本聚类方法第43-44页
   ·本章小结第44-45页
5 实验结果与分析第45-59页
   ·实验环境介绍及实验平台设计第45-48页
     ·实验环境介绍第45页
     ·实验平台设计第45-48页
   ·文本聚类实验平台的实现第48-53页
     ·文本预处理模块第48-49页
     ·特征项权值计算模块第49-50页
     ·特征集缩减模块第50页
     ·成对约束选取与半监督文本聚类模块第50-52页
     ·聚类结果评价及输出模块第52-53页
   ·实验结果及分析第53-57页
     ·语料库介绍第53页
     ·实验结果评价标准第53-54页
     ·实验结果与分析第54-57页
   ·本章小结第57-59页
6 总结与展望第59-61页
   ·总结第59页
   ·展望第59-61页
致谢第61-62页
参考文献第62-65页
附录第65页
 A. 作者在攻读学位期间发表的论文目录第65页
 B. 作者在攻读学位期间取得的科研成果目录第65页

论文共65页,点击 下载论文
上一篇:基于主动学习的半监督谱聚类算法研究
下一篇:面向网络服务的信息备份与还原技术研究及软件开发