首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向网页内容的K-means聚类算法的研究

摘要第1-6页
Abstract第6-11页
第1章 引言第11-15页
   ·研究背景和意义第11-12页
   ·研究现状及发展趋势第12-13页
   ·本文的工作第13-14页
   ·本文的组织第14-15页
第2章 相关知识第15-27页
   ·聚类的思想和流程第15-16页
   ·文本的表示第16-17页
   ·特征选择方法第17-19页
   ·特征权重计算方法第19-20页
   ·文档相似度计算方法第20-21页
   ·聚类算法介绍第21-26页
     ·基于层次的聚类算法第22-23页
     ·基于划分的聚类算法第23-24页
     ·基于密度的聚类算法第24页
     ·基于模型的聚类算法第24-25页
     ·聚类算法比较第25-26页
   ·本章小结第26-27页
第3章 网页内容聚类相似度度量和特征权重计算方法的改进第27-37页
   ·网页内容的特点分析第27-28页
   ·高维特征对数据挖掘的影响第28页
   ·高维空间的文档相似度计算方法第28-32页
     ·高维空间中L_k范数特性的探讨第28-29页
     ·高维空间相似度度量函数的重新设计第29-30页
     ·数据度量的规范化处理第30-31页
     ·Nsim()与其他相似性度量方法的比较分析第31-32页
   ·基于网页标签的TF-IDF权重计算方法的改进第32-35页
     ·TF-IDF详述第32-34页
     ·适用于网页内容的TF-IDF权重计算方法第34-35页
   ·本章小结第35-37页
第4章 基于网页内容的K-means聚类算法改进第37-55页
   ·K-means聚类算法的思想和流程第37-39页
   ·K-means算法缺点分析第39-40页
   ·问题的提出和方法的动机第40-41页
     ·问题的提出第40页
     ·方法的动机第40-41页
   ·K-means初始中心选择方法的改进第41-45页
     ·最大最小距离聚类算法第41-42页
     ·基于最大最小原则的K-means初始中心选择第42-43页
     ·初始距离最远的两个聚类中心的计算第43-45页
   ·空间模型修正第45-52页
     ·几种特征选择方法的比较第45-46页
     ·词频和文档频第46-47页
     ·簇间区分度第47-48页
     ·簇内分散偏差第48-49页
     ·位置重要性的度量第49页
     ·综合度量指标和算法描述第49-52页
   ·面向高维稀疏文本聚类的改进K-means算法的整体描述第52-53页
   ·本章小结第53-55页
第5章 实验设计与分析第55-63页
   ·基于人工判定的外部评价方法第55页
   ·实验环境第55-56页
     ·测试平台第55-56页
     ·实验数据第56页
   ·实验设计及结果分析第56-62页
     ·欧式距离和Nsim()度量比较实验第56-57页
     ·改进后的K-means算法与传统K-means聚类效果的比较第57-59页
     ·修正特征空间时不同特征选择方法的去噪效果比较第59-62页
   ·本章小结第62-63页
第6章 总结及工作展望第63-65页
   ·总结第63页
   ·工作展望第63-65页
参考文献第65-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:基于混沌的多媒体信息隐藏技术研究
下一篇:中国农村隐性失业问题研究