面向海量实时数据信息检索系统的研究与实现
| 摘要 | 第1-5页 |
| Abstract | 第5-6页 |
| 目录 | 第6-8页 |
| 第一章 绪 论 | 第8-12页 |
| ·背景介绍 | 第8页 |
| ·搜索引擎简介 | 第8-10页 |
| ·搜索引擎在海量实时环境下的问题 | 第10页 |
| ·研究内容 | 第10-11页 |
| ·本文主要内容介绍 | 第11-12页 |
| 第二章 GONIA系统介绍 | 第12-16页 |
| ·GONIA系统的分布式体系结构 | 第12-14页 |
| ·GONIA系统实现机制 | 第14-15页 |
| ·本章小结 | 第15-16页 |
| 第三章 海量数据的实时处理 | 第16-30页 |
| ·子系统入流量分析 | 第17-18页 |
| ·相关度反馈 | 第18-19页 |
| ·基于簇聚类技术的优化研究 | 第19-26页 |
| ·概念 | 第19-20页 |
| ·簇层次结构 | 第20-21页 |
| ·常用聚类算法 | 第21-22页 |
| ·两段向量聚类方法 | 第22-24页 |
| ·簇树建构 | 第24-26页 |
| ·簇聚类在海量实时网络数据下的应用 | 第26页 |
| ·群发邮件甄别 | 第26-28页 |
| ·概念 | 第26-27页 |
| ·垃圾邮件、群发邮件的关系 | 第27页 |
| ·单链接算法(single-link) | 第27-28页 |
| ·基于簇聚类的单链接算法 | 第28页 |
| ·本章小结 | 第28-30页 |
| 第四章 系统总体设计和详细实现 | 第30-44页 |
| ·系统总体设计原则 | 第30-33页 |
| ·系统总体结构 | 第33-35页 |
| ·重要数据结构 | 第35-39页 |
| ·搜集模块 | 第39-40页 |
| ·模块功能 | 第39页 |
| ·性能分析 | 第39-40页 |
| ·聚类模块 | 第40-41页 |
| ·模块功能 | 第40页 |
| ·性能分析 | 第40页 |
| ·文档插入 | 第40-41页 |
| ·内存管理机制 | 第41-43页 |
| ·管理构件 | 第41-42页 |
| ·性能分析 | 第42-43页 |
| ·本章小结 | 第43-44页 |
| 第五章 性能分析 | 第44-46页 |
| ·搜集性能 | 第44页 |
| ·群发邮件甄别率 | 第44-45页 |
| ·本章小结 | 第45-46页 |
| 第六章 总结与展望 | 第46-48页 |
| ·工作总结 | 第46页 |
| ·工作展望 | 第46-48页 |
| 参考文献 | 第48-49页 |
| 致谢 | 第49-50页 |
| 作者简介 | 第50页 |