聚类分析在Web文本挖掘中的应用研究

摘要	第1-5页
ABSTRACT	第5-9页
1 绪论	第9-15页
·课题研究的目的和意义	第9-10页
·研究现状	第10-12页
·聚类的研究现状	第10-11页
·文本聚类的研究现状	第11-12页
·Web 文本聚类面对的挑战	第12-15页
·本文的研究内容	第13-15页
2 Web 文本挖掘关键技术	第15-27页
·网页采集	第15页
·Web 文本信息提取	第15-19页
·网页内容结构的表示	第16-18页
·去噪	第18-19页
·分词	第19-20页
·Web 文本表示	第20-22页
·权值计算	第22-24页
·降维	第24-27页
·特征选择	第24-26页
·特征重构	第26-27页
3 Web 文本聚类研究	第27-38页
·聚类综述	第27-28页
·聚类过程	第28-30页
·欧氏距离和余弦距离	第30-31页
·典型文本聚类算法	第31-38页
·划分的k-means 算法	第31-32页
·层次的利用多代表点的聚类算法 CURE	第32-33页
·基于高密度连接区域的 DBSCAN 聚类算法	第33-34页
·基于神经网络模型的 SOM 算法	第34-36页
·模糊 C 均值聚类算法 FCM	第36-38页
4 聚类改进算法	第38-47页
·文本聚类算法存在的缺陷	第38-39页
·极大熵原理	第39-41页
·信息熵的定义	第39-40页
·极大熵准则	第40-41页
·极大熵聚类算法	第41-42页
·球面K 均值聚类算法	第42-44页
·改进的球面K 均值聚类算法	第44-47页
5 实验证明	第47-53页
·实验环境	第47页
·数据集的选择	第47页
·评价方法	第47-49页
·评价指标	第47-48页
·本实验的评价标准	第48-49页
·实验设计与结果分析	第49-53页
·实验设计	第49-51页
·结果分析	第51-53页
6 结论和展望	第53-55页
·结论	第53页
·展望	第53-55页
致谢	第55-56页
攻读硕士期间发表的论文	第56-57页
参考文献	第57-59页