摘要 | 第1-4页 |
Abstract | 第4-7页 |
第1章 绪论 | 第7-12页 |
·本文的研究背景及意义 | 第7-8页 |
·国内外研究现状 | 第8-9页 |
·本文的主要工作 | 第9-10页 |
·本文的研究目标 | 第10页 |
·本文的组织结构 | 第10-12页 |
第2章 博客与博客球的结构、特征分析 | 第12-15页 |
·博客概念定义 | 第12页 |
·博客的结构特点 | 第12-13页 |
·博客相关术语 | 第13-14页 |
·发布时间 | 第13页 |
·博客评论 | 第13-14页 |
·博客链接 | 第14页 |
·小结 | 第14-15页 |
第3章 博客球数据库的建立 | 第15-20页 |
·集群环境的建立 | 第15-16页 |
·分布式控制器系统 | 第16-17页 |
·页面抓取器系统 | 第17-18页 |
·负载平衡 | 第18页 |
·故障恢复 | 第18-19页 |
·系统部署和数据库搭建 | 第19页 |
·小结 | 第19-20页 |
第4章 SVD和NMF算法在博客球数据挖掘聚类中的应用 | 第20-31页 |
·数据预处理 | 第20-21页 |
·博客球向量空间模型的建立 | 第21-23页 |
·向量空间模型定义 | 第21页 |
·文本分词及权重计算 | 第21-23页 |
·SVD奇异值分解 | 第23-26页 |
·NMF非负矩阵分解 | 第26页 |
·矩阵运算相关代码 | 第26-30页 |
·小结 | 第30-31页 |
第5章 数据挖掘中聚类的典型算法分析与应用 | 第31-39页 |
·聚类概念 | 第31页 |
·k-means聚类算法 | 第31-33页 |
·k-means算法代码示例 | 第33-37页 |
·数据库表的设计 | 第37-38页 |
·小结 | 第38-39页 |
第6章 博客球数据挖掘聚类的研究 | 第39-49页 |
·博客数据挖掘的原理 | 第39页 |
·博客数据挖掘的流程 | 第39-42页 |
·博客信息提取 | 第39页 |
·文本矩阵建立 | 第39-40页 |
·特征值提取 | 第40页 |
·建立向量空间 | 第40-41页 |
·k-means聚类操作 | 第41-42页 |
·SVD对向量空间进行降维 | 第42-44页 |
·NMF对向量空间进行降维 | 第44-45页 |
·实验结果分析 | 第45-48页 |
·博客球聚类准确率对比试验 | 第45-47页 |
·读者评论对博客球聚类的影响试验 | 第47-48页 |
·小结 | 第48-49页 |
第7章 结论及展望 | 第49-51页 |
·结论 | 第49页 |
·不足与展望 | 第49-51页 |
致谢 | 第51-52页 |
参考文献 | 第52-55页 |
攻读硕士学位期间发表的论文 | 第55页 |