网络论坛话题发现与跟踪技术研究
摘要 | 第1-5页 |
Abstract | 第5-8页 |
第1章 绪论 | 第8-13页 |
·课题背景 | 第8-9页 |
·研究的目的和意义 | 第9-10页 |
·该领域的研究现状 | 第10-11页 |
·本文的研究内容 | 第11-13页 |
第2章 话题检测和追踪的相关研究 | 第13-26页 |
·话题发现与跟踪研究方法 | 第13-15页 |
·话题定义 | 第13页 |
·主要的研究方法 | 第13-15页 |
·文本聚类分析 | 第15-22页 |
·文本聚类分析的定义 | 第15-16页 |
·向量空间模型 | 第16-19页 |
·文本聚类分析的类别 | 第19-22页 |
·文本聚类中的关键技术 | 第22-25页 |
·自动分词 | 第22-23页 |
·特征矩阵压缩 | 第23-25页 |
·本章小结 | 第25-26页 |
第3章 基于高权重词集的增量聚类算法 | 第26-43页 |
·词语的权重 | 第26-30页 |
·词性权重 | 第26-28页 |
·词语的位置权重 | 第28-29页 |
·词频和倒排文档频度权重 | 第29-30页 |
·高权重词集 | 第30-31页 |
·层次聚类算法 | 第31-34页 |
·增量层次聚类算法 | 第34-39页 |
·算法的基本思想 | 第34-35页 |
·算法的实现 | 第35-37页 |
·算法的分析 | 第37-39页 |
·聚类参数的训练 | 第39-41页 |
·训练语料来源 | 第39页 |
·词语权重值的训练 | 第39-40页 |
·增量阈值的训练 | 第40-41页 |
·本章小结 | 第41-43页 |
第4章 论坛话题发现与跟踪系统设计 | 第43-57页 |
·论坛爬取平台 | 第43-45页 |
·系统分析模块 | 第45-49页 |
·文本预处理模块 | 第45-47页 |
·权重计算模块 | 第47页 |
·增量聚类模块 | 第47-49页 |
·实验结果及其评测 | 第49-53页 |
·实验条件 | 第49页 |
·评价方法介绍 | 第49-51页 |
·实验数据及结果评测 | 第51-53页 |
·热点话题获取和跟踪 | 第53-56页 |
·本章小结 | 第56-57页 |
结论 | 第57-59页 |
参考文献 | 第59-64页 |
致谢 | 第64页 |