首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

文本挖掘中的聚类算法研究

提要第1-9页
第1章 绪论第9-15页
   ·研究背景及意义第9-10页
   ·文本挖掘第10-12页
     ·文本挖掘的定义第10-11页
     ·文本挖掘的发展及现状第11-12页
   ·文本聚类第12-14页
     ·聚类分析及应用第12页
     ·文本聚类的研究现状第12-14页
   ·本文工作和内容安排第14-15页
第2章 聚类分析第15-21页
   ·聚类分析的定义第15页
   ·聚类的数据类型第15-17页
     ·数据矩阵第15-16页
     ·相异度矩阵第16页
     ·区间标度变量第16-17页
   ·相似度量方法第17-19页
     ·距离第17-18页
     ·相似系数第18-19页
   ·聚类方法分类第19-21页
第3章 文本聚类方法分析第21-29页
   ·文本聚类的定义第21页
   ·文本聚类的一般过程第21-22页
   ·文本聚类建模方法分析第22-25页
     ·分词处理与词频统计第22-23页
     ·特征项的选取第23-24页
     ·文本向量模型第24页
     ·TF-IDF 权重的计算第24-25页
     ·文档相似度度量第25页
   ·文本聚类算法分析第25-29页
     ·算法的选择第25-26页
     ·基于划分的K-means 聚类算法第26-27页
     ·K-means 算法初值依赖性的讨论第27页
     ·有关初值选取的现有方法第27-29页
第4章 聚类算法的分析与比较研究第29-53页
   ·基于划分的 K-means 聚类算法第29-34页
     ·K-means 聚类算法的主要思想第29页
     ·K-means 聚类算法描述第29-30页
     ·基于实例数据集的 K-means 聚类算法测试第30-33页
     ·K-means 算法的性能分析第33-34页
   ·层次聚类算法第34-39页
     ·层次聚类第34页
     ·层次聚类的基本步骤第34-35页
     ·基于实例数据集的层次聚类算法测试第35-39页
     ·层次聚类的性能分析第39页
   ·基于密度的 DBSCAN 聚类算法第39-43页
     ·基于密度的DBSCAN 的相关定义第40页
     ·基于密度的DBSCAN 的主要思想第40-41页
     ·基于实例数据集的 DBSCAN 算法测试第41-43页
     ·DBSCAN 聚类算法的性能分析第43页
   ·模糊聚类第43-51页
     ·模糊聚类概述第43页
     ·模糊聚类算法的主要思想第43-44页
     ·基于实例的FCM 模糊算法测试第44-51页
   ·算法性能的衡量指标第51页
   ·聚类算法性能比较第51-53页
第5章 文本聚类原型系统的设计与实现第53-65页
   ·文本聚类原型系统的设计第53-55页
     ·文本聚类原型系统的功能分析第53页
     ·文本聚类原型系统的模块设计第53-54页
     ·语料库的选择第54-55页
     ·聚类算法的选择第55页
   ·文本聚类原型系统功能模块的实现第55-58页
     ·K-means 算法的实现流程及关键代码第55-57页
     ·文本聚类原型系统的界面设计第57-58页
   ·文本聚类原型系统的测试及结果分析第58-65页
     ·聚类准确度评价第58-59页
     ·K-means 算法中参数K 对聚类结果影响的分析第59-63页
     ·随机种子参数变化对聚类结果影响的分析第63页
     ·语料输入顺序的改变对聚类结果的影响分析第63-65页
第6章 结束语第65-67页
   ·结论第65页
   ·今后的工作展望第65-67页
参考文献第67-70页
致谢第70-71页
摘要第71-73页
Abstract第73-75页

论文共75页,点击 下载论文
上一篇:大型疾病监控预警系统的研究与设计
下一篇:基于XML的数据集成技术的研究与实现