| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 第1章 绪论 | 第9-13页 |
| ·课题背景 | 第9页 |
| ·课题来源 | 第9页 |
| ·课题的国内外研究现状 | 第9-11页 |
| ·课题研究的目标和意义 | 第11-12页 |
| ·论文结构 | 第12-13页 |
| 第2章 文本相似度计算 | 第13-19页 |
| ·文本相似度概述 | 第13页 |
| ·文本相似度计算方法介绍 | 第13-18页 |
| ·文档相似度计算方法 | 第13-16页 |
| ·短文本相似度计算方法 | 第16-18页 |
| ·本章小结 | 第18-19页 |
| 第3章 基于特征扩展和 WordNet 的微博语义相似度计算方法 | 第19-41页 |
| ·WordNet 简介 | 第19-26页 |
| ·WordNet 节点间的关系 | 第19-22页 |
| ·WordNet 中各类词性的组织 | 第22-24页 |
| ·WordNet 在计算机中的存储结构和使用方式 | 第24-26页 |
| ·基于 VSM 的余弦相似度计算方法 | 第26-28页 |
| ·基于 WordNet 的语义相似度计算方法 | 第28-30页 |
| ·基于维基百科的微博特征扩展 | 第30-32页 |
| ·实验步骤与结果分析 | 第32-39页 |
| ·实验数据集和评估方法 | 第32-33页 |
| ·实验步骤与结果分析 | 第33-39页 |
| ·本章小结 | 第39-41页 |
| 第4章 开放实时数据处理平台 Twitter Storm | 第41-52页 |
| ·Storm 简介 | 第41-42页 |
| ·Storm 的架构及核心概念 | 第42-48页 |
| ·Storm 整体架构 | 第42-43页 |
| ·Storm 中的关键概念 | 第43-48页 |
| ·Storm 的核心处理思想 | 第48-49页 |
| ·一个自定义 topology 结构实例 | 第49-51页 |
| ·本章小结 | 第51-52页 |
| 第5章 基于 Twitter Storm 平台的微博检索实现 | 第52-66页 |
| ·实验准备 | 第52-53页 |
| ·数据集预处理 | 第52页 |
| ·Twitter Storm 环境的搭建 | 第52-53页 |
| ·实验步骤 | 第53-62页 |
| ·对 Twitter Storm 进行多语言的扩展 | 第53-57页 |
| ·实时微博检索的 topology 的结构 | 第57-62页 |
| ·本地模拟的实验结果 | 第62-65页 |
| ·本章小结 | 第65-66页 |
| 第6章 总结和展望 | 第66-68页 |
| ·工作总结 | 第66-67页 |
| ·展望 | 第67-68页 |
| 致谢 | 第68-69页 |
| 参考文献 | 第69-72页 |
| 攻读学位期间取得的学位论文相关科研成果 | 第72页 |