基于特征词的文本聚类算法研究

摘要	第1-4页
ABSTRACT	第4-6页
目录	第6-8页
第1章绪论	第8-17页
·研究背景和选题意义	第8-9页
·国内外研究现状	第9-11页
·文本数据挖掘概述	第11-16页
·文本挖掘的含义	第11-12页
·文本挖掘与数据挖掘	第12-13页
·文本挖掘研究的内容	第13-14页
·文本挖掘中的课题	第14-16页
·主要内容及组织结构	第16-17页
第2章文本聚类预处理关键技术的讨论	第17-31页
·文本预处理	第17-20页
·分词	第17-19页
·停用词处理	第19页
·同义词归并	第19-20页
·文本特征表示	第20-22页
·布尔逻辑模型	第20页
·向量空间模型	第20-21页
·其它模型	第21-22页
·特征选择方法	第22-25页
·特征项选择原则	第22-23页
·基于评估函数的特征选择	第23-25页
·特征权重计算的研究和改进	第25-28页
·特征项权重计算函数	第25-27页
·对TF-IDF的改进	第27-28页
·文本相似度计算	第28-29页
·本章小结	第29-31页
第3章常用的文本聚类算法分析	第31-44页
·基于划分的方法	第31-33页
·基于层次的方法	第33-35页
·基于密度的方法	第35-37页
·基于网格的方法	第37-38页
·基于模型的方法	第38-39页
·文本聚类算法的比较标准	第39-43页
·本章小结	第43-44页
第4章基于topN特征词的文本聚类算法	第44-55页
·验证改进后的TF-IDF权重计算方法	第44-47页
·特征降维topN方法及其验证	第47-50页
·特征降维topN方法	第47-48页
·实验过程及结果分析	第48-50页
·基于topN特征词的文本聚类算法	第50-53页
·初始聚类中心的优化思想	第51-52页
·基于topN特征词的文本聚类算法描述	第52-53页
·实验过程与结果分析	第53页
·本章小结	第53-55页
总结与展望	第55-57页
致谢	第57-58页
参考文献	第58-63页
攻读硕士学位期间发表的论文及科研项目	第63页