基于划分的聚类算法及其在Web挖掘中的应用

摘要	第1-5页
Abstract	第5-8页
1 绪论	第8-11页
·课题背景及研究意义	第8-9页
·国内外研究现状和发展趋势	第9-10页
·本文主要内容	第10-11页
2 聚类分析算法	第11-23页
·数据挖掘相关知识	第11-16页
·数据挖掘概念	第11-14页
·Web挖掘的研究领域	第14-16页
·聚类分析应用	第16页
·聚类分析方法	第16-20页
·划分方法	第17-18页
·层次方法	第18页
·基于密度的方法	第18-19页
·基于模型的方法	第19页
·基于网格的方法	第19页
·聚类算法比较	第19-20页
·K-Means聚类算法详述	第20-23页
·K-Means聚类算法框架	第20-22页
·K-Means聚类算法步骤	第22-23页
3 文本预处理	第23-35页
·文本预处理模型	第23-27页
·文本的表示	第24页
·中文文本的分词和预处理	第24-26页
·文档相似度的定义	第26-27页
·特征词条权重计算方法	第27-28页
·特征项频率反文档频率的改进	第28-31页
·TFIDF详述	第28-30页
·适用于网页的TFIDF	第30-31页
·特征集的缩减	第31-35页
·缩减特征集的意义	第31-32页
·特征数目对聚类结果的影响	第32-35页
4 改进的基于划分的文档聚类算法	第35-51页
·基于划分的聚类算法	第35-38页
·基于划分的聚类算法思想	第35页
·K-Means算法分析	第35-38页
·基于最大最小距离法的文档聚类算法	第38-51页
·最大最小距离聚类算法步骤	第38-41页
·最大最小距离聚类算法参数及缺点分析	第41页
·初始中心选取方法	第41-45页
·合并中心点的层次凝聚思想	第45-47页
·初始中心选取方法流程	第47-48页
·基于最大最小距离法的文档聚类算法	第48-51页
5 实验结果	第51-56页
·聚类结果评价	第51-52页
·实验分析	第52-54页
·对公安网页的聚类	第54-56页
结论	第56-57页
参考文献	第57-60页
攻读硕士学位期间发表学术论文情况	第60-61页
致谢	第61-62页