首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于K-means算法的文本聚类的研究与实现

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-14页
   ·论文的研究背景和意义第10-11页
   ·国内外研究现状第11-13页
   ·论文的研究目的第13页
   ·论文的内容与结构安排第13-14页
第二章 文本挖掘及关键技术概述第14-34页
   ·数据挖掘第14-17页
     ·数据挖掘的含义第14页
     ·数据挖掘的过程第14-15页
     ·数据挖掘系统基本成分第15-16页
     ·数据挖掘的相关技术第16-17页
   ·文本挖掘第17-21页
     ·文本挖掘的概念第17-18页
     ·文本挖掘的内容第18-19页
     ·文本挖掘的过程第19页
     ·文本挖掘与自然语言处理之间的差别第19-20页
     ·文本挖掘的应用领域第20-21页
   ·文本聚类第21-23页
     ·文本聚类的概念第21页
     ·常用的文本聚类方法第21-22页
     ·文本聚类的特点与难点第22-23页
   ·文本聚类的关键技术第23-33页
     ·文本表示第24-25页
     ·文本特征项的权重计算第25-26页
     ·文本预处理第26-28页
     ·特征降维第28-30页
     ·文本的相似度计算第30-33页
   ·本章小结第33-34页
第三章 文本聚类算法分析第34-42页
   ·几种典型的文本聚类算法第34-36页
     ·基于划分的方法第34页
     ·基于层次的方法第34-35页
     ·基于密度的方法第35页
     ·基于网格的方法第35页
     ·基于模型的方法第35-36页
   ·聚类算法的典型要求第36-37页
   ·传统 K-means 算法第37-39页
     ·K-means 算法概述第37-38页
     ·算法执行举例第38-39页
   ·文本聚类的质量评价第39-41页
     ·熵第39页
     ·特征测量第39-40页
     ·整体相似度第40页
     ·纯度第40-41页
     ·F 值第41页
   ·小结第41-42页
第四章 K-means 算法的改进第42-53页
   ·传统 K-means 算法的特点第42-43页
     ·算法的优点第42页
     ·算法存在的局限性第42-43页
   ·改进 K-means 算法的提出第43页
   ·K-means 算法现有的改进算法第43-45页
     ·K-众数算法第43-44页
     ·EM 算法第44-45页
   ·改进的 K-means 算法中 k 值的确定第45-48页
     ·基本思想第45-46页
     ·具体步骤第46-47页
     ·算法分析第47-48页
   ·优化 K-means 算法的初始聚类中心第48-52页
     ·现有初始聚类中心的选择方法第48-49页
     ·改进的初始聚类中心选择方法第49-51页
     ·算法分析第51-52页
   ·小结第52-53页
第五章 系统设计与性能分析第53-62页
   ·实验环境第53页
   ·系统结构第53-57页
     ·预处理第53-55页
     ·聚类分析第55-57页
   ·实验结果与性能分析第57-61页
     ·实验结果第57-59页
     ·性能分析第59-61页
   ·小结第61-62页
第六章 总结与展望第62-63页
参考文献第63-66页
致谢第66-67页
个人简历、在学期间发表的学术论文与研究成果第67页

论文共67页,点击 下载论文
上一篇:基于演化蚁群算法的TSP问题研究及应用
下一篇:基于用户兴趣的个性化信息检索分析与研究