首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于词频和语义的文本聚类算法研究

摘要第4-5页
abstract第5页
第一章 绪论第8-13页
    1.1 研究背景第8-9页
    1.2 国内外发展现状第9-10页
    1.3 文本聚类现存问题第10-11页
    1.4 主要研究内容第11页
    1.5 论文组织第11-13页
第二章 基于词频和语义的文本聚类概述第13-23页
    2.1 基于词频的文本聚类概述第13-17页
        2.1.1 基于划分的聚类算法第14页
        2.1.2 基于层次的聚类算法第14-15页
        2.1.3 基于密度的聚类算法第15-16页
        2.1.4 基于网格的聚类算法第16-17页
    2.2 文本相似度计算规则第17-18页
        2.2.1 欧氏距离第17页
        2.2.2 余弦距离第17页
        2.2.3 曼哈顿距离第17-18页
        2.2.4 切比雪夫距离第18页
    2.3 基于语义的文本聚类概述第18-22页
        2.3.1 基于隐性语义分析的聚类算法第18-20页
        2.3.2 基于概率主题模型的文本聚类算法第20-21页
        2.3.3 基于LDA模型的文本聚类算法第21-22页
    2.4 本章小结第22-23页
第三章 基于密度与最小距离的K-means文本聚类算法第23-30页
    3.1 基于统计的K-means聚类算法介绍第23-24页
        3.1.1 K-means算法描述第23-24页
    3.2 基于密度与最小距离的K-means聚类算法第24-27页
        3.2.1 基本定义第24-25页
        3.2.2 算法的详细描述第25-27页
    3.3 实验结果及分析第27-29页
        3.3.1 数据集描述第27页
        3.3.2 实验结果第27-29页
    3.4 本章小结第29-30页
第四章 基于潜在概率主题模型的KNN文本聚类算法第30-38页
    4.1 基于传统的TF-IDF空间向量模型的KNN文本聚类算法第30-32页
        4.1.1 传统的文本表示模型-空间向量模型第30-31页
        4.1.2 基于向量空间模型的KNN文本聚类算法介绍第31-32页
    4.2 基于概率主题模型的KNN文本聚类算法第32-34页
        4.2.1 PLSA文本生成和表示模型第32-34页
        4.2.2 基于概率主题模型的文本聚类算法描述第34页
    4.3 实验结果分析第34-37页
        4.3.1 性能评估指标第34-35页
        4.3.2 实验环境第35页
        4.3.3 实验结果第35-37页
    4.4 本章小结第37-38页
第五章 基于概率主题模型LDA的KNN文本聚类算法第38-43页
    5.1 基于概率主题模型PLSA的文本聚类算法第38-40页
        5.1.1 PLSA-KNN文本表示和生成模型第38-39页
        5.1.2 基于概率主题模型PLSA-KNN的算法描述第39-40页
    5.2 基于概率主题模型LDA的文本聚类算法第40-42页
        5.2.1 LDA的文本生成和表示模型第41页
        5.2.2 基于LDA的KNN文本聚类算法描述第41-42页
    5.3 本章小结第42-43页
第六章 总结与展望第43-45页
    6.1 论文工作总结第43页
    6.2 进一步工作展望第43-45页
参考文献第45-48页
附录1 攻读硕士学位期间撰写的论文第48-49页
附录2 攻读硕士学位期间参加的科研项目第49-50页
致谢第50页

论文共50页,点击 下载论文
上一篇:基于GIS技术的风暴潮灾害风险评估研究--以舟山市定海区为例
下一篇:基于关键字固定的微博热点话题语义层面切分