首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于混合文本集的文本聚类方法研究

摘要第5-6页
ABSTRACT第6页
第1章 绪论第9-14页
    1.1 研究背景及意义第9-10页
    1.2 国内外研究现状第10-12页
    1.3 本文研究内容第12-14页
第2章 文本聚类相关技术综述第14-23页
    2.1 文本表示方法第14-17页
        2.1.1 基于代数论的模型第14-16页
        2.1.2 基于集合论的模型第16-17页
    2.2 特征降维方法第17-18页
        2.2.1 特征选择方法第17页
        2.2.2 特征提取方法第17-18页
    2.3 文本相似度与聚类质量评价第18-20页
        2.3.1 文本相似度度量第18-19页
        2.3.2 聚类质量的评估第19-20页
    2.4 几种主要的聚类算法第20-22页
        2.4.1 基于划分的聚类方法第21页
        2.4.2 基于层次的聚类方法第21页
        2.4.3 基于密度的聚类方法第21-22页
        2.4.4 基于网格的聚类方法第22页
        2.4.5 基于模型的聚类方法第22页
    2.5 本章小结第22-23页
第3章 基于混合文本集的K-means文本聚类算法第23-30页
    3.1 K-means算法第23-24页
        3.1.1 K-means算法描述第23-24页
        3.1.2 K-means算法缺点分析第24页
    3.2 基于混合文本集的K-means文本聚类改进算法第24-29页
        3.2.1 文本指纹的生成第25-26页
        3.2.2 基于混合文本集的K-means文本聚类算法描述第26-28页
        3.2.3 基于混合文本集的K-means文本聚类算法分析第28-29页
    3.3 本章小结第29-30页
第4章 基于混合文本集的文本聚类优化算法第30-35页
    4.1 基于距离的孤立点检测改进算法第30-32页
        4.1.1 基于距离的孤立点检测方法第30-31页
        4.1.2 孤立点检测改进算法描述第31-32页
        4.1.3 孤立点检测改进算法分析第32页
    4.2 基于距离的初始点选择改进算法第32-33页
        4.2.1 初始点选择改进算法描述第32-33页
        4.2.2 初始点选择改进算法分析第33页
    4.3 基于混合文本集的文本聚类优化算法第33-34页
        4.3.1 基于混合文本集的文本聚类优化算法描述第33-34页
        4.3.2 基于混合文本集的文本聚类优化算法分析第34页
    4.4 本章小结第34-35页
第5章 实验结果与分析第35-45页
    5.1 实验说明第35页
    5.2 基于混合文本集的K-means文本聚类算法实验第35-40页
        5.2.1 文本指纹生成第36-37页
        5.2.2 对比实验结果及分析第37-40页
    5.3 基于距离的孤立点检测改进算法实验第40-41页
    5.4 基于距离的初始点选择改进算法实验第41-43页
    5.5 基于混合文本集的文本聚类优化算法实验第43-44页
    5.6 本章小结第44-45页
第6章 总结与展望第45-47页
    6.1 工作总结第45页
    6.2 工作展望第45-47页
致谢第47-48页
参考文献第48-54页
附录第54-55页
详细摘要第55-57页

论文共57页,点击 下载论文
上一篇:文本分类中特征选择算法的研究与改进
下一篇:基于GPR预判模型的海量日志流实时异常检测研究