摘要 | 第1-6页 |
ABSTRACT | 第6-13页 |
第1章 引言 | 第13-21页 |
·论文介绍 | 第13页 |
·高效数据流处理算法研究 | 第13-19页 |
·数据流背景介绍 | 第13-14页 |
·高维数据流变化检测算法研究现状和本文工作 | 第14-15页 |
·高维数据流聚类算法研究现状和本文工作 | 第15-17页 |
·滑动窗口上数据流副本检测算法研究现状和本文工作 | 第17-18页 |
·滑动窗口上概率数据流副本检测算法研究现状和本文工作 | 第18-19页 |
·海量文本分类算法研究 | 第19-20页 |
·背景介绍 | 第19页 |
·研究现状 | 第19-20页 |
·本文工作 | 第20页 |
·本文的组织 | 第20-21页 |
第2章 一种适用于高维数据流的变化检测方法 | 第21-35页 |
·引言 | 第21页 |
·相关概念 | 第21-22页 |
·Hoeffding边界极其推广 | 第22-24页 |
·定理 | 第22-23页 |
·定理推广及在变化检测中应用 | 第23-24页 |
·记录网格中数据分布变化信息 | 第24-29页 |
·基本假设 | 第24-25页 |
·区间的说明和问题的转化 | 第25-26页 |
·构造经验分布变化表格 | 第26-27页 |
·VT树的构造 | 第27-28页 |
·算法说明与分析 | 第28-29页 |
·利用VT树发现所有变化值显著的网格 | 第29-30页 |
·算法和分析 | 第29-30页 |
·实验分析 | 第30-32页 |
·实验设计 | 第30页 |
·实验结果 | 第30-32页 |
·结语 | 第32-35页 |
第3章 一种基于代表点的高维数据流聚类算法 | 第35-45页 |
·引言 | 第35页 |
·聚类背景知识 | 第35-36页 |
·高维数据特点 | 第36-38页 |
·CluRDP算法 | 第38-42页 |
·各维度上的量化方法 | 第38-39页 |
·CluRDP算法的历史数据抛弃方法 | 第39-41页 |
·CluRDP算法 | 第41-42页 |
·实验结果 | 第42-43页 |
·结语 | 第43-45页 |
第4章 一种滑动窗口上数据流副本检测的有效算法 | 第45-69页 |
·引言 | 第45页 |
·Flag Bloom Filter | 第45-49页 |
·动机 | 第45-46页 |
·Flag Bloom Filter | 第46页 |
·使用FBF检测副本 | 第46-47页 |
·循环等级与元素生命期之间的转换 | 第47-49页 |
·算法性能分析 | 第49-58页 |
·误否错误率 | 第49-51页 |
·误是错误率 | 第51-58页 |
·基于FBF的成块处理数据流的副本检测算法 | 第58-63页 |
·b_FBF算法 | 第58-59页 |
·算法性能分析 | 第59-63页 |
·实验 | 第63-67页 |
·本章总结 | 第67-69页 |
第5章 一种滑动窗口上概率数据流副本检测的有效算法 | 第69-77页 |
·引言 | 第69-70页 |
·Floating Counter Bloom Filter | 第70-72页 |
·一种基于FCBF的滑动窗口上概率数据流副本检测算法 | 第72-75页 |
·实验 | 第75-76页 |
·结论 | 第76-77页 |
第6章 基于增量学习型矢量量化的海量文本分类方法 | 第77-97页 |
·算法预备知识 | 第77-78页 |
·学习型矢量量化 | 第77页 |
·生长型神经气 | 第77-78页 |
·改进的增量LVQ算法 | 第78-88页 |
·扩大类间距离和压缩类心样本的学习规则 | 第78-80页 |
·基于最小化学习误差增量来学习类内样本 | 第80-88页 |
·实验分析 | 第88-91页 |
·评价指标 | 第88-89页 |
·实验设计 | 第89页 |
·实验结果 | 第89-91页 |
·一种简单的算法 | 第91-95页 |
·与LVQ1的比较 | 第91页 |
·增长机制 | 第91-92页 |
·学习顺序问题 | 第92-93页 |
·改进的LVQ1算法 | 第93-94页 |
·实验 | 第94-95页 |
·总结 | 第95-97页 |
第7章 总结 | 第97-101页 |
·高效数据流处理算法研究 | 第97-98页 |
·海量文本分类算法研究 | 第98-99页 |
·高效数据流处理算法研究展望 | 第99页 |
·海量文本分类算法研究展望 | 第99-101页 |
参考文献 | 第101-109页 |
致谢 | 第109-111页 |
在读期间发表的学术论文与取得的研究成果 | 第111-112页 |