首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于RI方法的文本聚类研究

摘要第3-5页
ABSTRACT第5-6页
第1章 绪论第10-16页
    1.1 课题研究背景及选题意义第10-11页
        1.1.1 研究背景第10页
        1.1.2 选题意义第10-11页
    1.2 文本聚类研究现状第11-14页
    1.3 论文研究内容及组织结构第14-15页
        1.3.1 研究内容第14页
        1.3.2 组织结构第14-15页
    1.4 本章小结第15-16页
第2章 文本聚类相关技术第16-28页
    2.1 文本预处理第16-17页
        2.1.1 文本分词第16页
        2.1.2 特征词提取第16-17页
    2.2 常见的文本表示模型第17-20页
        2.2.1 VSM文本表示模型第17-18页
        2.2.2 LSA文本表示模型第18-19页
        2.2.3 PLSA文本表示模型第19-20页
    2.3 文本聚类中相似度计算第20-21页
    2.4 特征词汇加权第21-23页
    2.5 文本聚类效果的评估第23-24页
    2.6 常见的文本聚类算法第24-27页
        2.6.1 基于K-Means的文本聚类算法第24-25页
        2.6.2 基于AGNES的文本聚类算法第25页
        2.6.3 基于FCM的文本聚类算法第25-27页
    2.7 本章小结第27-28页
第3章 基于RI方法的文本表示第28-42页
    3.1 RI方法介绍第28-34页
        3.1.1 RI方法简介第28-31页
        3.1.2 RI方法描述第31-33页
        3.1.3 使用RI方法进行文本聚类的优势和不足第33-34页
    3.2 面向文本聚类需要的RI方法第34-37页
        3.2.1 随机索引改进第34-35页
        3.2.2 混合加权改进第35-37页
    3.3 基于RI方法的文本表示示例第37-40页
    3.4 本章小结第40-42页
第4章 基于改进K-Means+AGNES聚类算法第42-52页
    4.1 文本聚类的总体流程第42页
    4.2 K-Means算法的改进第42-50页
        4.2.1 传统K-Means算法存在的两个主要问题第42-43页
        4.2.2 基于关联度的初始中心自动选取第43-47页
        4.2.3 基于紧密度和分散度的最佳初始聚类自动确定第47-50页
    4.3 改进K-Means的AGNES聚类算法第50-51页
        4.3.1 基于AGNES聚类方法中存在的问题第50页
        4.3.2 改进K-Means+AGNES聚类算法描述第50-51页
    4.4 本章小结第51-52页
第5章 基于RI的文本聚类模型测试及对比分析第52-65页
    5.1 测试数据及测试环境第52页
        5.1.1 测试语料选择第52页
        5.1.2 测试环境第52页
    5.2 聚类效果的评估指标第52-53页
    5.3 测试步骤第53-54页
    5.4 基于RI的聚类模型中有关参数值的获取第54-56页
    5.5 改进前后文本表示能力的对比分析第56-58页
    5.6 改进前后K-Means+AGNES聚类算法的对比分析第58-61页
    5.7 基于RI的聚类模型的测试及对比分析第61-63页
        5.7.1 对比文本聚类模型的选择第61页
        5.7.2 算法的测试及聚类效果的对比分析第61-63页
    5.8 本章小结第63-65页
第6章 总结与展望第65-67页
    6.1 论文工作总结第65页
    6.2 进一步研究方向第65-67页
致谢第67-68页
参考文献第68-70页

论文共70页,点击 下载论文
上一篇:Apla GUI程序生成系统设计与实现
下一篇:广义双层伯格曼字典学习的非凸磁共振图像重建算法