面向海量实时数据信息检索系统的研究与实现
摘要 | 第1-5页 |
Abstract | 第5-6页 |
目录 | 第6-8页 |
第一章 绪 论 | 第8-12页 |
·背景介绍 | 第8页 |
·搜索引擎简介 | 第8-10页 |
·搜索引擎在海量实时环境下的问题 | 第10页 |
·研究内容 | 第10-11页 |
·本文主要内容介绍 | 第11-12页 |
第二章 GONIA系统介绍 | 第12-16页 |
·GONIA系统的分布式体系结构 | 第12-14页 |
·GONIA系统实现机制 | 第14-15页 |
·本章小结 | 第15-16页 |
第三章 海量数据的实时处理 | 第16-30页 |
·子系统入流量分析 | 第17-18页 |
·相关度反馈 | 第18-19页 |
·基于簇聚类技术的优化研究 | 第19-26页 |
·概念 | 第19-20页 |
·簇层次结构 | 第20-21页 |
·常用聚类算法 | 第21-22页 |
·两段向量聚类方法 | 第22-24页 |
·簇树建构 | 第24-26页 |
·簇聚类在海量实时网络数据下的应用 | 第26页 |
·群发邮件甄别 | 第26-28页 |
·概念 | 第26-27页 |
·垃圾邮件、群发邮件的关系 | 第27页 |
·单链接算法(single-link) | 第27-28页 |
·基于簇聚类的单链接算法 | 第28页 |
·本章小结 | 第28-30页 |
第四章 系统总体设计和详细实现 | 第30-44页 |
·系统总体设计原则 | 第30-33页 |
·系统总体结构 | 第33-35页 |
·重要数据结构 | 第35-39页 |
·搜集模块 | 第39-40页 |
·模块功能 | 第39页 |
·性能分析 | 第39-40页 |
·聚类模块 | 第40-41页 |
·模块功能 | 第40页 |
·性能分析 | 第40页 |
·文档插入 | 第40-41页 |
·内存管理机制 | 第41-43页 |
·管理构件 | 第41-42页 |
·性能分析 | 第42-43页 |
·本章小结 | 第43-44页 |
第五章 性能分析 | 第44-46页 |
·搜集性能 | 第44页 |
·群发邮件甄别率 | 第44-45页 |
·本章小结 | 第45-46页 |
第六章 总结与展望 | 第46-48页 |
·工作总结 | 第46页 |
·工作展望 | 第46-48页 |
参考文献 | 第48-49页 |
致谢 | 第49-50页 |
作者简介 | 第50页 |