Web文本聚类与分类算法研究

摘要	第1-6页
Abstract	第6-10页
第1章绪论	第10-12页
·引言	第10-11页
·研究背景	第10页
·研究意义	第10-11页
·国内外研究现状	第11页
·本文组织结构与研究内容	第11-12页
第2章 Web文本聚类与分类相关概念	第12-23页
·数据挖掘	第12页
·Web数据挖掘	第12-13页
·Web挖掘的概念	第12页
·Web挖掘分类	第12-13页
·Web文本挖掘	第13-14页
·Web文本挖掘的定义	第13页
·Web文本挖掘的一般过程	第13-14页
·Web文本的表示	第14-15页
·布尔模型	第14-15页
·概率某型	第15页
·向量空间模型	第15页
·Web文本特征提取	第15-17页
·特征词频—文档频率权重(TF—IDF)	第16页
·信息增益(IG)	第16页
·互信息(MI)	第16-17页
·χ~2(CHI)统计	第17页
·Web文本分类器	第17-20页
·朴素贝叶斯分类器	第17-18页
·K近邻分类法器(KNN)	第18页
·支持向量机分类器	第18-19页
·评价标准	第19-20页
·Web文本聚类	第20-22页
·划分聚类方法	第20-21页
·层次聚类方法	第21-22页
·评价标准	第22页
·本章小结	第22-23页
第3章基于相关性聚类的Web文本特征提取算法	第23-31页
·引言	第23页
·TF-IDF特征词提取算法问题分析	第23-24页
·特征词共现的相关性聚类思想	第24页
·相关性聚类思想	第24页
·相关性的描述	第24页
·k-means算法在文本特征提取中的局限性	第24-26页
·聚类中心点无意义	第25页
·初始聚类中心点依赖性	第25页
·最临近原则的影响	第25-26页
·基于改进k-means的特征提取算法	第26-29页
·基于特征词共现的相关性描述	第26-27页
·k-means算法的改进策略	第27-28页
·算法描述	第28-29页
·实验与结果分析	第29-30页
·本章小结	第30-31页
第4章基于PSO改进的k-means Web文本聚类算法	第31-43页
·引言	第31页
·问题描述	第31-33页
·粒子群算法简介	第33-38页
·基本粒子群算法	第33-34页
·标准粒子群算法	第34-35页
·基本流程	第35-37页
·优化聚类中的应用	第37-38页
·改进k-means Web文本聚类算法	第38-41页
·基于PSO的改进策略	第38-40页
·算法描述	第40-41页
·实验及结果分析	第41-42页
·本章小结	第42-43页
第5章一种改进的KNN Web文本分类器	第43-51页
·引言	第43页
·KNN算法问题分析	第43-45页
·影响KNN分类的因素	第44-45页
·现有的改进策略	第45页
·改进的KNN Web文本分类算法	第45-48页
·改进策略	第45-47页
·算法描述	第47-48页
·实验与结果分析	第48-50页
·本章小结	第50-51页
第6章总结与展望	第51-53页
·全文总结	第51页
·工作展望	第51-53页
参考文献	第53-56页
读硕期间公开发表的论文	第56-57页
致谢	第57-58页