首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于模型的文本聚类算法研究

摘要第3-4页
Abstract第4-5页
主要符号对照表第9-10页
第1章 绪论第10-16页
    1.1 研究动机第10-13页
    1.2 主要研究内容与贡献第13-15页
    1.3 章节安排第15-16页
第2章 研究现状与相关工作第16-26页
    2.1 基于划分的聚类算法第16-18页
    2.2 基于层次的聚类算法第18-20页
    2.3 基于密度的聚类算法第20-21页
    2.4 基于模型的聚类算法第21-22页
    2.5 评价方法第22-26页
        2.5.1 同质性与完全性第23页
        2.5.2 兰德指数第23-24页
        2.5.3 基于信息论的方法第24-25页
        2.5.4 本章小结第25-26页
第3章 基于狄利克雷多项式混合模型的文本聚类算法第26-51页
    3.1 引言第26-27页
    3.2 基础知识第27-32页
        3.2.1 狄利克雷分布第27-28页
        3.2.2 多项式分布第28页
        3.2.3 混合模型第28-29页
        3.2.4 狄利克雷多项式混合模型第29-31页
        3.2.5 吉布斯采样算法第31-32页
    3.3 算法第32-38页
        3.3.1 电影小组过程第32-33页
        3.3.2 GSDMM聚类算法第33-36页
        3.3.3 GSDMM聚类算法的推导第36-38页
    3.4 讨论第38-40页
        3.4.1 参数Alpha和Beta的意义第38-39页
        3.4.2 与朴素贝叶斯分类器的关系第39页
        3.4.3 GSDMM聚类算法的复杂度分析第39-40页
    3.5 实验研究第40-50页
        3.5.1 实验数据第40-41页
        3.5.2 评价标准第41页
        3.5.3 聚类模型的比较第41-43页
        3.5.4 迭代次数的影响第43-45页
        3.5.5 初始簇数目的影响第45-46页
        3.5.6 参数Alpha的影响第46-48页
        3.5.7 参数Beta的影响第48-49页
        3.5.8 GSDMM聚类算法的可伸缩性第49-50页
    3.6 本章小结第50-51页
第4章 基于狄利克雷过程多项式混合模型的文本聚类算法第51-77页
    4.1 引言第51-52页
    4.2 基础知识第52-55页
        4.2.1 狄利克雷过程第52-53页
        4.2.2 Stick-Breaking构造第53-54页
        4.2.3 狄利克雷过程多项式混合模型第54-55页
    4.3 算法第55-64页
        4.3.1 选择已有的簇第55-60页
        4.3.2 选择新的簇第60-62页
        4.3.3 GSDPMM聚类算法第62-64页
    4.4 讨论第64-66页
        4.4.1 高维问题第64页
        4.4.2 异常检测第64页
        4.4.3 一个文档归属于一个簇第64-65页
        4.4.4 簇的表示第65-66页
    4.5 实验研究第66-74页
        4.5.1 实验数据第66页
        4.5.2 与现有方法的比较第66-68页
        4.5.3 可扩展性第68-69页
        4.5.4 异常检测第69-70页
        4.5.5 自动发现簇的数目第70-72页
        4.5.6 平衡完全性和同质性第72-73页
        4.5.7 对簇的表示第73-74页
    4.6 本章小结第74-77页
第5章 基于在线聚类思想的文本聚类算法第77-93页
    5.1 引言第77-78页
    5.2 FGSDMM聚类算法第78-81页
    5.3 FGSDMM+聚类算法第81-83页
    5.4 实验研究第83-91页
        5.4.1 实验数据第83-84页
        5.4.2 与已有方法的比较第84-85页
        5.4.3 算法的速度第85-86页
        5.4.4 迭代次数的影响第86-87页
        5.4.5 假定簇数目的上限的影响第87-89页
        5.4.6 参数Alpha的影响第89-90页
        5.4.7 参数Beta的影响第90-91页
    5.5 本章小结第91-93页
第6章 总结与展望第93-95页
    6.1 研究总结第93-94页
    6.2 研究展望第94-95页
参考文献第95-106页
致谢第106-109页
个人简历、在学期间发表的学术论文与研究成果第109-110页

论文共110页,点击 下载论文
上一篇:交变磁场下Cu-Fe原位复合材料组织与性能研究
下一篇:基于熔体状态提升N型Bi-Te-Se基半导体热电性能的新方法探索