基于Web文本的聚类算法的应用研究

摘要	第1-5页
ABSTRACT	第5-9页
第1章绪论	第9-13页
·研究背景	第9-10页
·课题研究的意义	第10页
·Web 文本聚类面对的挑战	第10-11页
·本文的主要内容结构	第11-13页
第2章相关概念	第13-17页
·数据挖掘	第13-14页
·数据挖掘特点	第13页
·数据挖掘常用方法	第13-14页
·WEB文本挖掘	第14-15页
·Web 挖掘	第14页
·文本挖掘简介	第14-15页
·数据标准化	第15页
·文本表示	第15-16页
·向量空间模型	第15-16页
·特征抽取	第16页
·本章小结	第16-17页
第3章 WEB 文本挖掘技术	第17-22页
·WEB文本挖掘的过程	第17-18页
·WEB 文本预处理技术	第18-21页
·Web 文本去噪	第18页
·中文文本分词	第18-19页
·文本特征表示	第19-20页
·文本特征选取	第20-21页
·本章小结	第21-22页
第4章基于遗传策略的特征选取方法	第22-29页
·遗传算法	第22页
·基于遗传策略的特征选取方法	第22-27页
·基本思想	第22-23页
·算法的基本流程	第23-27页
·实验分析	第27-28页
·本章小结	第28-29页
第5章基于文本的聚类算法的改进与应用	第29-48页
·文本聚类	第29-32页
·聚类的研究属性	第29-30页
·文本聚类的特点	第30-32页
·文本聚类算法的比较	第32页
·聚类算法的比较	第32-33页
·K-means 算法分析	第33页
·K-means 算法	第33页
·经典K-means 算法的局限性	第33页
·改进 K-means(WIPD)算法	第33-39页
·基本思想	第33-34页
·检测提取孤立点阶段	第34-36页
·聚类阶段	第36-37页
·整理阶段	第37页
·算法步骤	第37-39页
·改进K-means 算法聚类流程	第39页
·实验与分析	第39-41页
·聚类性能评价指标	第39-40页
·文本数据聚类实验	第40-41页
·改进后聚类算法的原型系统的实现实验论证	第41-47页
·实现环境	第41页
·数据集的选取	第41-42页
·评价方法	第42-47页
·本章小结	第47-48页
第6章总结与展望	第48-49页
参考文献	第49-53页
致谢	第53-54页
附录	第54页