基于句子级最大频繁单词集的Web文档聚类研究

摘要	第1-4页
ABSTRACT	第4-8页
1 绪论	第8-16页
·课题背景	第8-10页
·Web 信息特点	第8-9页
·Web 信息的检索方法	第9页
·检索Web 的局限	第9-10页
·文档聚类的意义	第10-13页
·Web 聚类的出现	第10-11页
·Web 聚类的意义	第11-13页
·国内外研究概况	第13-14页
·课题的来源以及本文的工作	第14-16页
2 Web 文档聚类概述	第16-23页
·文档聚类的定义	第16-17页
·文档聚类技术分类	第17-21页
·AHC 算法	第18-19页
·K-means 算法	第19页
·SOM 算法	第19-21页
·文档聚类基本过程	第21-22页
·本章小结	第22-23页
3 Web 文档模型表示	第23-32页
·文档表示模型的分类	第23-27页
·布尔逻辑型	第24页
·向量空间型	第24-26页
·概率型	第26-27页
·文档数据库模型	第27-30页
·文档数据库模型	第27-28页
·文档的预处理	第28页
·挖掘句子级的最大频繁单词集	第28-29页
·建立文档集特征矩阵	第29-30页
·本章小结	第30-32页
4 基于句子级最大频繁单词集 Web 文档聚类	第32-42页
·初步聚类	第32-33页
·计算每个类的特征向量	第33-36页
·可变精度粗糙集计算权值	第33-36页
·精确聚类	第36-37页
·聚类描述	第37-41页
·聚类描述扩展	第37-38页
·基于容错粗糙集的聚类描述扩展	第38-41页
·本章小结	第41-42页
5 算法实现以及实验	第42-47页
·算法给出	第42-44页
·基于句子集频繁单词集的文本聚类算法	第42-43页
·基于容错粗糙集的聚类描述扩展算法	第43-44页
·实验	第44-47页
6 结论与工作展望	第47-49页
·主要工作及创新点	第47页
·工作展望	第47-49页
致谢	第49-50页
参考文献	第50-54页
附录1 攻读学位期间发表论文目录	第54页