基于博客的网络话题发现及追踪的研究
中文摘要 | 第1-6页 |
ABSTRACT | 第6-9页 |
1 引言 | 第9-14页 |
·研究背景及意义 | 第9-10页 |
·网络话题发现及追踪的研究背景 | 第9-10页 |
·网络话题发现及追踪的研究意义 | 第10页 |
·网络话题发现及追踪技术简介及国内外研究现状 | 第10-12页 |
·课题研究内容及论文结构 | 第12-13页 |
·论文中符号应用的表示说明 | 第13-14页 |
2 基于博客的网络话题向量空间模型改进 | 第14-22页 |
·博客文本信息的特征表示 | 第14页 |
·传统的文本向量空间建立方法 | 第14-17页 |
·基于博客的改进TFIDF算法的向量空间的建立 | 第17-19页 |
·改进的TFIDF算法验证 | 第19-22页 |
3 文本特征向量空间降维的研究 | 第22-27页 |
·文本特征向量空间降维的必要性 | 第22页 |
·文本特征向量空间降维的思想及实现 | 第22-25页 |
·特征向量空间降维的基本思想 | 第22-23页 |
·特征项聚类 | 第23-24页 |
·潜在语义索引 | 第24-25页 |
·应用潜在语义索引实现降维的实验验证 | 第25-27页 |
4 基于博客的网络话题发现的研究 | 第27-43页 |
·经典聚类算法介绍分析 | 第27-33页 |
·基于划分思想的聚类算法 | 第27-30页 |
·基于层次思想的聚类算法 | 第30-32页 |
·基于密度思想的聚类算法 | 第32-33页 |
·用于博客话题发现的聚类算法改进 | 第33-43页 |
·已有聚类算法不足分析 | 第33-35页 |
·HD-K-means算法设计思想 | 第35页 |
·HD-K-means算法描述 | 第35-38页 |
·HD-K-means算法性能分析 | 第38-40页 |
·HD-K-means算法聚类结果验证 | 第40-41页 |
·细粒度话题的发现 | 第41-43页 |
5 基于博客的网络话题追踪的研究 | 第43-52页 |
·网络话题追踪的基本实现思想 | 第43页 |
·传统分类算法介绍及分析 | 第43-48页 |
·分类的过程描述 | 第43-44页 |
·朴素贝叶斯分类器算法分析 | 第44-45页 |
·K最近邻分类器算法分析 | 第45-46页 |
·决策树分类器算法分析 | 第46-48页 |
·基于博客的网络话题追踪的实现 | 第48-52页 |
·基于博客的网络话题发现实现架构及分析 | 第48-49页 |
·分类特征词选择及类别条件概率计算 | 第49-50页 |
·改进的朴素贝叶斯分类器的效果 | 第50-51页 |
·细粒度话题的追踪 | 第51-52页 |
6 基于博客的网络话题发现及追踪整体实现 | 第52-58页 |
·整体设计简介 | 第52-54页 |
·文章信息存储数据结构的设计 | 第52-53页 |
·系统主体类设计 | 第53-54页 |
·实验结果及分析 | 第54-58页 |
7 总结及展望 | 第58-59页 |
·总结 | 第58页 |
·展望 | 第58-59页 |
参考文献 | 第59-63页 |
作者简历 | 第63-65页 |
学位论文数据集 | 第65页 |