基于染色传播的关键词聚类算法研究
摘要 | 第5-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第12-22页 |
1.1 选题背景与意义 | 第12-13页 |
1.2 研究现状 | 第13-21页 |
1.2.1 基于划分的聚类算法 | 第14-15页 |
1.2.2 基于层次的聚类算法 | 第15-16页 |
1.2.3 基于图论的聚类算法 | 第16-18页 |
1.2.4 基于密度的聚类算法 | 第18-19页 |
1.2.5 基于网格的聚类算法 | 第19页 |
1.2.6 基于模型的聚类算法 | 第19-20页 |
1.2.7 聚类算法目前研究方向 | 第20页 |
1.2.8 关键词聚类 | 第20-21页 |
1.3 论文组织结构 | 第21-22页 |
第二章 词向量模型 | 第22-37页 |
2.1 分词 | 第22页 |
2.2 词频与逆文档频率 | 第22-23页 |
2.3 统计语言模型 | 第23-25页 |
2.4 神经网络语言模型 | 第25-28页 |
2.5 word2vec | 第28-36页 |
2.5.1 CBOW模型 | 第29-32页 |
2.5.2 Skip- gram模型 | 第32-34页 |
2.5.3 负采样算法 | 第34-36页 |
2.6 本章小结 | 第36-37页 |
第三章分布式图并行计算 | 第37-44页 |
3.1 分布式计算 | 第37-38页 |
3.2 块同步并行模型 | 第38-40页 |
3.3 ODPS-graph框架 | 第40-43页 |
3.3.1 Graph的数据结构 | 第40-41页 |
3.3.2 Graph程序逻辑 | 第41-43页 |
3.3.3 Graph的优点 | 第43页 |
3.4 本章小结 | 第43-44页 |
第四章 聚类步骤与效果评估 | 第44-54页 |
4.1 相似性度量 | 第44-47页 |
4.2 聚类分析步骤 | 第47-48页 |
4.3 聚类算法评价标准 | 第48页 |
4.4 聚类效果评测 | 第48-51页 |
4.5 常用的聚类算法 | 第51页 |
4.6 K-means算法 | 第51-53页 |
4.7 本章小结 | 第53-54页 |
第五章聚集系数极大值点染色传播聚类算法 | 第54-73页 |
5.1 算法思想 | 第55-58页 |
5.1.1 算法步骤简介 | 第57-58页 |
5.1.2 算法停止证明 | 第58页 |
5.2 算法详细步骤 | 第58-63页 |
5.2.1 计算聚集系数 | 第59页 |
5.2.2 计算聚集系数极大值点 | 第59-60页 |
5.2.3 染色传播 | 第60-61页 |
5.2.4 顶点归属 | 第61-63页 |
5.3 阈值切边逐层聚类 | 第63-66页 |
5.3.1 第一轮聚类 | 第64页 |
5.3.2 第二轮聚类 | 第64-65页 |
5.3.3 第k(k>=3)轮聚类 | 第65-66页 |
5.3.4 最后一轮聚类 | 第66页 |
5.4 算法并行化 | 第66-69页 |
5.4.1 计算聚集系数并行化 | 第66-67页 |
5.4.2 计算局部极大值点并行化 | 第67页 |
5.4.3 染色传播并行化 | 第67-68页 |
5.4.4 顶点归属并行化 | 第68-69页 |
5.5 算法复杂度分析 | 第69-72页 |
5.5.1 计算聚集系数复杂度 | 第69-70页 |
5.5.2 计算聚集系数极大值点复杂度 | 第70页 |
5.5.3 染色传播复杂度 | 第70页 |
5.5.4 顶点归属复杂度 | 第70-71页 |
5.5.5 总复杂度 | 第71-72页 |
5.6 算法的优缺点 | 第72页 |
5.7 本章小结 | 第72-73页 |
第六章 实验结果与分析 | 第73-80页 |
6.1 实验数据 | 第73页 |
6.2 实验过程 | 第73-75页 |
6.3 对比实验与结果分析 | 第75-79页 |
6.4 本章小结 | 第79-80页 |
总结与展望 | 第80-82页 |
参考文献 | 第82-91页 |
攻读硕士学位期间取得的研究成果 | 第91-92页 |
致谢 | 第92-93页 |
附件 | 第93页 |