Web中文文本聚类研究

摘要	第1-6页
ABSTRACT	第6-11页
第1章绪论	第11-17页
·引言.	第11页
·Web 文本挖掘技术介绍	第11-12页
·Web 文本聚类的研究意义	第12-14页
·Web 中文文本聚类技术	第14-15页
·本文工作及组织	第15-17页
·本文工作	第15页
·本文组织	第15-17页
第2章 Web 文本聚类技术综述	第17-28页
·文本表示模型	第17-18页
·向量空间模型	第17-18页
·后缀树文本模型	第18页
·文本特征降维	第18-20页
·文本相似度计算	第20-22页
·文本对象之间的相似度	第20-21页
·文本对象之间的相异度	第21页
·文本集合与文本集合之间的邻近性度量	第21-22页
·文本聚类算法	第22-25页
·划分方法	第22-23页
·层次方法	第23-24页
·基于密度方法	第24页
·基于网格方法	第24-25页
·基于模型方法	第25页
·语义相关问题	第25-26页
·文本聚类效果的评价指标	第26-27页
·本章小结	第27-28页
第3章基于MapReduce 的海量Web 中文文本聚类	第28-43页
·MapReduce 相关技术介绍	第28-33页
·背景	第28-29页
·编程模式	第29页
·实现框架	第29-31页
·Hadoop 与MapReduce	第31-33页
·基于MapReduce 的文本集合的tfidf 算法设计	第33-35页
·基于MapReduce 的文本集合的canopy 聚类算法设计	第35-36页
·Canopy 聚类	第35-36页
·canopy 文本聚类算法在MapReduce 上的设计	第36页
·基于MapReduce 的文本集合的K-means 聚类算法设计	第36-38页
·K-means 聚类	第36-37页
·K-means 文本聚类算法在MapReduce 上的设计	第37-38页
·实验仿真	第38-42页
·实验平台的搭建	第38-39页
·实验数据	第39页
·实验结果	第39-42页
·本章小结	第42-43页
第4章基于后缀树的实时Web 文本聚类	第43-54页
·后缀树数据结构	第43-45页
·后缀树介绍	第43-44页
·后缀树的构造	第44-45页
·后缀树文本模型及其算法	第45-47页
·中文特点	第46页
·中文的后缀树文本模型及其算法	第46-47页
·中文后缀树聚类算法STCC 的流程设计	第47-50页
·文本预处理	第47页
·利用后缀树提取文本特征	第47-49页
·文本聚类	第49-50页
·实验与分析	第50-53页
·实验数据	第51页
·实验结果与分析	第51-53页
·本章小结	第53-54页
第5章总结与展望	第54-56页
·总结	第54页
·展望	第54-56页
致谢	第56-57页
参考文献	第57-60页
附录	第60页