| 摘要 | 第1-4页 |
| ABSTRACT | 第4-8页 |
| 绪论 | 第8-14页 |
| 一 课题研究的背景 | 第8-9页 |
| 二 课题研究的理论与实际意义 | 第9-10页 |
| 三 课题研究现状 | 第10-11页 |
| 四 Web 数据挖掘面临的问题 | 第11-12页 |
| 五 论文的主要研究内容 | 第12-14页 |
| 第一章 Web 数据挖掘概述 | 第14-28页 |
| ·Web 数据挖掘的定义 | 第14-15页 |
| ·Web 数据挖掘分类 | 第15-17页 |
| ·Web 使用模式挖掘 | 第15-16页 |
| ·Web 结构挖掘 | 第16页 |
| ·Web 内容挖掘 | 第16-17页 |
| ·Web 数据挖掘和Web 信息检索 | 第17-19页 |
| ·Web 信息检索的定义 | 第17-18页 |
| ·两者的关系 | 第18-19页 |
| ·常用Web 文本聚类方法 | 第19-24页 |
| ·基于划分的聚类方法 | 第19-21页 |
| ·基于层次的聚类方法 | 第21-22页 |
| ·基于空间索引的聚类方法 | 第22-24页 |
| ·其他聚类方法 | 第24页 |
| ·Web 文本聚类结果评估及选型 | 第24-27页 |
| ·聚簇评估 | 第24-25页 |
| ·聚类算法的选择 | 第25-27页 |
| 本章小结 | 第27-28页 |
| 第二章 Web 文本聚类关键技术 | 第28-40页 |
| ·Web 文本数据格式分析 | 第28-29页 |
| ·Web 文本表示方法 | 第29-31页 |
| ·Web 文本特征提取 | 第31-34页 |
| ·独立评估方法 | 第31-33页 |
| ·综合评估方法 | 第33-34页 |
| ·特征抽取方法的特点 | 第34页 |
| ·相似性测度 | 第34-36页 |
| ·聚类结果可视化技术研究 | 第36-39页 |
| ·数据可视化技术的基本概念 | 第36-38页 |
| ·主要的数据可视化技术 | 第38-39页 |
| 本章小结 | 第39-40页 |
| 第三章 基于改进的 K-Means 算法的 Web 文本聚类研究 | 第40-58页 |
| ·划分聚类算法介绍 | 第40-43页 |
| ·划分算法概述 | 第40-41页 |
| ·K-means 算法基本思想 | 第41-42页 |
| ·K-means 算法面临的主要问题 | 第42-43页 |
| ·改善权重计算方案 | 第43-47页 |
| ·传统的权重调整公式分析 | 第43-44页 |
| ·新的权重调整方案 | 第44-47页 |
| ·聚类结果的数据可视化研究与改进 | 第47-50页 |
| ·基于树图的聚类可视化 | 第47-48页 |
| ·基于几何的散点图可视化 | 第48-49页 |
| ·动态交互聚类数据可视化技术 | 第49-50页 |
| ·并行 K-means 算法 | 第50-56页 |
| ·并行聚类现状和策略 | 第50-51页 |
| ·并行K-means 算法的实现 | 第51-55页 |
| ·并行算法分析和实验验证 | 第55-56页 |
| 本章小结 | 第56-58页 |
| 第四章 Web 文本聚类系统设计与试验分析 | 第58-65页 |
| ·系统总体结构和功能模块 | 第58-62页 |
| ·Web 文本预处理模块 | 第59-60页 |
| ·聚类分析模块 | 第60-61页 |
| ·前台用户交互模块 | 第61-62页 |
| ·Web 文本聚类系统应用分析 | 第62-64页 |
| ·Web 文本数据集及预处理 | 第62-63页 |
| ·聚类结果演示 | 第63-64页 |
| 本章小结 | 第64-65页 |
| 结论 | 第65-67页 |
| 参考文献 | 第67-70页 |
| 攻读硕士学位期间发表的学术论文 | 第70-71页 |
| 致谢 | 第71-72页 |