首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

聚类分析在文本挖掘中的应用与研究

摘要第3-4页
Abstract第4页
第一章 绪论第7-13页
    1.1 研究背景与意义第7-9页
    1.2 国内外研究现状第9-10页
    1.3 本文研究内容第10-11页
    1.4 论文的组织结构第11-13页
第二章 文本挖掘综述第13-22页
    2.1 文本挖掘定义第13页
    2.2 文本挖掘任务第13-14页
    2.3 文本表示模型第14-15页
        2.3.1 VSM模型第14页
        2.3.2 布尔模型第14-15页
        2.3.3 概率模型第15页
    2.4 文本相似度计算方法第15-17页
        2.4.1 基于集合模型相似度计算第15-16页
        2.4.2 基于向量的相似度计算第16-17页
        2.4.3 广义向量空间模型第17页
    2.5 文本向量降维技术第17-20页
        2.5.1 特征选择第18页
        2.5.2 特征抽取第18-20页
    2.6 文本挖掘面临的新课题第20-21页
    2.7 本章小结第21-22页
第三章 聚类分析之快速密度峰值搜索算法及其改进第22-38页
    3.1 聚类分析原理第22-25页
        3.1.1 聚类分析定义第22页
        3.1.2 聚类分析的数据类型第22-23页
        3.1.3 距离和相似系数第23-25页
    3.2 聚类分析算法分类第25-27页
        3.2.1 基于划分的方法第25-26页
        3.2.2 基于层次的方法第26页
        3.2.3 基于密度的方法第26页
        3.2.4 基于网格的方法第26-27页
        3.2.5 基于模型的方法第27页
    3.3 聚类算法性能的评估第27页
    3.4 快速密度峰值搜索算法及其改进第27-37页
        3.4.1 快速密度峰值搜索算法(CFSFDP)第28-32页
        3.4.2 改进的快速密度峰值搜索算法(PE-CFSFDP)第32-35页
        3.4.3 实验结果分析第35-37页
    3.5 本章小结第37-38页
第四章 一种融合k-means和PE-CFSFDP算法的聚类方法第38-46页
    4.1 K-means算法第38-39页
        4.1.1 算法思想第38-39页
        4.1.2 算法的缺陷分析第39页
    4.2 K-means算法与PE-CFSFDP算法的融合第39-41页
        4.2.1 使用熵值法确定各数据对象间赋权欧氏距离第39-40页
        4.2.2 K-CFSFDP算法描述第40-41页
    4.3 实验分析第41-45页
    4.4 本章小结第45-46页
第五章K-CFSFDP算法在文本聚类挖掘中的应用第46-57页
    5.1 文本聚类的过程第46-47页
    5.2 相关技术第47-49页
        5.2.1 中文分词器第47-48页
        5.2.2 去除停用词第48页
        5.2.3 文本聚类实验数据来源第48-49页
    5.3 文本聚类具体实现第49-56页
        5.3.1 开发环境第49页
        5.3.2 系统的总控件模块设计第49-50页
        5.3.3 模块的详细设计第50-54页
        5.3.4 运行结果分析第54-56页
    5.4 本章小节第56-57页
第六章 总结与展望第57-59页
    6.1 总结第57页
    6.2 展望第57-59页
致谢第59-60页
参考文献第60-63页
附录: 作者在攻读硕士学位期间发表的论文第63页

论文共63页,点击 下载论文
上一篇:宫崎骏电影中的生态女性主义研究--以《风之谷》《幽灵公主》《起风了》为例
下一篇:缝合破碎人生—从《梅丽迪安》看艾丽斯·沃克妇女主义理论的萌芽