首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本聚类算法分析与研究

摘要第5-7页
ABSTRACT第7-8页
第一章 绪论第11-16页
    1.1 引言第11页
    1.2 文本挖掘简介第11-13页
    1.3 文本聚类的广泛应用第13页
    1.4 文本聚类问题的数学描述第13-14页
    1.5 本文的组织结构第14-15页
    1.6 本章小结第15-16页
第二章 向量空间模型第16-27页
    2.1 文本表示模型第16-17页
    2.2 文本分词第17-21页
    2.3 向量空间模型第21-23页
    2.4 文本中项的选择第23-25页
    2.5 项的权重的计算第25-26页
    2.6 本章小结第26-27页
第三章 传统的聚类算法第27-41页
    3.1 基于划分的方法第27-30页
        3.1.1 K -平均算法(K-Means)第28-29页
        3.1.2 K-中心算法第29-30页
    3.2 基于层次的方法第30-33页
        3.2.1 BIRCH 算法第30-32页
        3.2.2 CURE 算法第32-33页
    3.3 基于密度的方法第33-35页
        3.3.1 DBSCAN 算法第33-35页
    3.4 基于网格的方法第35-37页
        3.4.1 STING 算法第35-36页
        3.4.2 CLIQUE 算法第36-37页
    3.5 基于模型的方法第37-38页
        3.5.1 EM 算法第37-38页
    3.6 聚类算法之间的比较第38-39页
    3.7 聚类算法的要求第39-40页
    3.8 本章小结第40-41页
第四章 CHAMELEON 算法及K-C 算法的研究第41-50页
    4.1 CHAMELEON 算法的研究第41-43页
    4.2 CHAMELEON 算法的优点与不足第43页
    4.3 算法改进思想第43-44页
    4.4 K-C 算法第44-49页
    4.5 本章小结第49-50页
第五章 文本聚类算法实验及结果分析第50-63页
    5.1 中文文本聚类模型第50-53页
    5.2 聚类算法结果判定标准第53-54页
    5.3 聚类对比实验第54-61页
        5.3.1 Chameleon 算法及K-C 算法对比传统算法优势实验第55-57页
        5.3.2 Chameleon 算法及K-C 算法参数选取实验第57-58页
        5.3.3 K-means 算法,Chameleon 算法及K-C 算法中文文本聚类对比实验第58-59页
        5.3.4 文本向量的维数对整个聚类过程及聚类结果的影响第59-60页
        5.3.5 不同的领域对中文本聚类的结果的影响第60-61页
    5.4 实验结果分析第61-62页
    5.5 本章小结第62-63页
第六章 总结与展望第63-65页
参考文献第65-69页
致谢第69-70页
攻读硕士学位期间已发表或录用的论文第70-72页

论文共72页,点击 下载论文
上一篇:基于评价对象及其情感特征的中文文本倾向性分类研究
下一篇:视频中的行人检测与异常行为检测方法研究