首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

面向大规模数据的在线新事件检测

摘要第1-6页
Abstract第6-9页
第1章 引言第9-16页
   ·课题背景第9-10页
   ·基本概念第10-11页
   ·研究现状第11-14页
   ·研究意义第14页
   ·研究内容及组织结构第14-16页
     ·研究内容第14-15页
     ·组织结构第15-16页
第2章 新事件检测和分布式计算常用技术第16-31页
   ·新事件检测技术第16-24页
     ·文本预处理第16-17页
     ·文本表示模型第17-19页
     ·特征提取第19-21页
     ·文本相似度计算第21-22页
     ·相似度阈值第22-23页
     ·类的表示第23-24页
     ·基本NED算法第24页
   ·Hadoop分布式计算平台第24-30页
     ·MapReduce模型第25-27页
     ·Hadoop分布式文件系统第27-28页
     ·MapReduce编程第28-30页
   ·本章小结第30-31页
第3章 面向大规模数据的在线新事件检测算法第31-36页
   ·基于新闻要素的在线新事件检测算法第31-33页
     ·报道和事件的表示模型第31-32页
     ·报道和事件相似度的计算第32页
     ·新事件检测方法第32-33页
   ·改进的快速新事件检测算法第33-35页
     ·基准算法的时间损耗分析第33-34页
     ·报道预处理的并行化第34页
     ·使用索引机制减少报道的比较次数第34-35页
     ·倒排索引的设计与查找过程的并行化第35页
     ·报道与事件比较过程的并行化第35页
   ·本章小结第35-36页
第4章 大规模在线新事件检测系统的设计和实现第36-47页
   ·系统总体架构设计第36-37页
   ·报道预处理模块第37-40页
   ·报道索引模块第40-41页
   ·相似度比较模块第41-44页
   ·事件聚类模块第44-45页
   ·作业管理模块第45-46页
   ·本章小结第46-47页
第5章 实验结果和分析第47-58页
   ·实验环境搭建第47-51页
   ·评测语料第51页
   ·评测标准第51-52页
   ·实验结果分析第52-57页
     ·漏检率和误报率对比第52-53页
     ·Hadoop系统参数的影响第53-54页
     ·算法速度测试第54-56页
     ·系统可扩展性测试第56-57页
   ·本章小结第57-58页
第6章 总结和展望第58-60页
   ·总结第58页
   ·展望第58-60页
参考文献第60-63页
致谢第63-64页
附录第64页

论文共64页,点击 下载论文
上一篇:在线客服中基于扩展蚁群算法的学习路径推荐方法研究
下一篇:网络行为及网络信息利用