基于博客的网络话题发现及追踪的研究
| 中文摘要 | 第1-6页 |
| ABSTRACT | 第6-9页 |
| 1 引言 | 第9-14页 |
| ·研究背景及意义 | 第9-10页 |
| ·网络话题发现及追踪的研究背景 | 第9-10页 |
| ·网络话题发现及追踪的研究意义 | 第10页 |
| ·网络话题发现及追踪技术简介及国内外研究现状 | 第10-12页 |
| ·课题研究内容及论文结构 | 第12-13页 |
| ·论文中符号应用的表示说明 | 第13-14页 |
| 2 基于博客的网络话题向量空间模型改进 | 第14-22页 |
| ·博客文本信息的特征表示 | 第14页 |
| ·传统的文本向量空间建立方法 | 第14-17页 |
| ·基于博客的改进TFIDF算法的向量空间的建立 | 第17-19页 |
| ·改进的TFIDF算法验证 | 第19-22页 |
| 3 文本特征向量空间降维的研究 | 第22-27页 |
| ·文本特征向量空间降维的必要性 | 第22页 |
| ·文本特征向量空间降维的思想及实现 | 第22-25页 |
| ·特征向量空间降维的基本思想 | 第22-23页 |
| ·特征项聚类 | 第23-24页 |
| ·潜在语义索引 | 第24-25页 |
| ·应用潜在语义索引实现降维的实验验证 | 第25-27页 |
| 4 基于博客的网络话题发现的研究 | 第27-43页 |
| ·经典聚类算法介绍分析 | 第27-33页 |
| ·基于划分思想的聚类算法 | 第27-30页 |
| ·基于层次思想的聚类算法 | 第30-32页 |
| ·基于密度思想的聚类算法 | 第32-33页 |
| ·用于博客话题发现的聚类算法改进 | 第33-43页 |
| ·已有聚类算法不足分析 | 第33-35页 |
| ·HD-K-means算法设计思想 | 第35页 |
| ·HD-K-means算法描述 | 第35-38页 |
| ·HD-K-means算法性能分析 | 第38-40页 |
| ·HD-K-means算法聚类结果验证 | 第40-41页 |
| ·细粒度话题的发现 | 第41-43页 |
| 5 基于博客的网络话题追踪的研究 | 第43-52页 |
| ·网络话题追踪的基本实现思想 | 第43页 |
| ·传统分类算法介绍及分析 | 第43-48页 |
| ·分类的过程描述 | 第43-44页 |
| ·朴素贝叶斯分类器算法分析 | 第44-45页 |
| ·K最近邻分类器算法分析 | 第45-46页 |
| ·决策树分类器算法分析 | 第46-48页 |
| ·基于博客的网络话题追踪的实现 | 第48-52页 |
| ·基于博客的网络话题发现实现架构及分析 | 第48-49页 |
| ·分类特征词选择及类别条件概率计算 | 第49-50页 |
| ·改进的朴素贝叶斯分类器的效果 | 第50-51页 |
| ·细粒度话题的追踪 | 第51-52页 |
| 6 基于博客的网络话题发现及追踪整体实现 | 第52-58页 |
| ·整体设计简介 | 第52-54页 |
| ·文章信息存储数据结构的设计 | 第52-53页 |
| ·系统主体类设计 | 第53-54页 |
| ·实验结果及分析 | 第54-58页 |
| 7 总结及展望 | 第58-59页 |
| ·总结 | 第58页 |
| ·展望 | 第58-59页 |
| 参考文献 | 第59-63页 |
| 作者简历 | 第63-65页 |
| 学位论文数据集 | 第65页 |