| 目录 | 第1-7页 |
| 摘要 | 第7-9页 |
| ABSTRACT | 第9-11页 |
| 第一章 绪论 | 第11-22页 |
| ·研究背景 | 第11-14页 |
| ·数据挖掘技术的产生和发展 | 第11-12页 |
| ·高维数据挖掘 | 第12-14页 |
| ·研究现状 | 第14-16页 |
| ·高维数据的相似性查询 | 第14-15页 |
| ·高维数据聚类和异常检测 | 第15-16页 |
| ·高维数据挖掘所遇到的困难及其研究方向 | 第16-19页 |
| ·高维数据的特点 | 第16-17页 |
| ·维火(the curse of dimensionality) | 第17页 |
| ·高维对数据挖掘的影响 | 第17-18页 |
| ·高维数据挖掘的研究方向 | 第18-19页 |
| ·本文的贡献 | 第19页 |
| ·术语和符号约定 | 第19-20页 |
| ·基本术语 | 第20页 |
| ·符号约定 | 第20页 |
| ·论文结构 | 第20-22页 |
| 第二章 高维数据的相似性查询处理 | 第22-32页 |
| ·相似性查询 | 第22-23页 |
| ·维归约 | 第23-25页 |
| ·选维 | 第23页 |
| ·降维 | 第23-25页 |
| ·高维索引结构 | 第25-27页 |
| ·相似性查询方法 | 第27-30页 |
| ·RKV算法 | 第27-29页 |
| ·HS算法 | 第29-30页 |
| ·其它高维数据的相似性搜索算法 | 第30页 |
| ·高维数据相似性搜索方法的讨论 | 第30-31页 |
| ·维归约技术的局限 | 第30-31页 |
| ·高维索引结构在性能上的局限 | 第31页 |
| ·本章小结 | 第31-32页 |
| 第三章 一种新的高维数据相似性度量函数HSIM() | 第32-44页 |
| ·最近邻查询的不稳定性 | 第32页 |
| ·高维空间中的最近邻特性 | 第32-36页 |
| ·高维空间中的L_K-范数特性的深入探讨 | 第36页 |
| ·高维空间距离函数的重新设计 | 第36-38页 |
| ·HSlM()函数的讨论 | 第38-39页 |
| ·Hsim()函数的推广 | 第38-39页 |
| ·数据的规范化 | 第39页 |
| ·对高维数据中空值的处理 | 第39页 |
| ·HSIM()与其它相似性度量方法的比较 | 第39-43页 |
| ·由距离度量转换来的相似性度量 | 第40-41页 |
| ·Cosine度量 | 第41-42页 |
| ·Pearson相关系数 | 第42-43页 |
| ·Jaccard系数 | 第43页 |
| ·本章小结 | 第43-44页 |
| 第四章 量化交易数据的相似性搜索 | 第44-56页 |
| ·量化交易数据 | 第44-45页 |
| ·量化交易数据的相似性度量 | 第45页 |
| ·索引结构的建立 | 第45-49页 |
| ·特征表 | 第45-46页 |
| ·特征划分 | 第46-49页 |
| ·相似性搜索算法 | 第49-51页 |
| ·举例 | 第51-53页 |
| ·性能分析 | 第53-55页 |
| ·本章小结 | 第55-56页 |
| 第五章 一种基于评分的协同过滤算法 | 第56-63页 |
| ·相关研究工作 | 第56-59页 |
| ·基于用户的推荐算法 | 第57-58页 |
| ·基于项的推荐算法 | 第58-59页 |
| ·两种推荐算法的比较 | 第59页 |
| ·维归约技术 | 第59页 |
| ·基于特征表的评分数据协同过滤算法[YZS03] | 第59-61页 |
| ·相似性度量 | 第59页 |
| ·基于特征表的协同过滤算法 | 第59-61页 |
| ·实验评价 | 第61-62页 |
| ·数据集 | 第61页 |
| ·评价指标 | 第61页 |
| ·实验结果 | 第61-62页 |
| ·本章小结 | 第62-63页 |
| 第六章 高维数据聚类算法分析 | 第63-81页 |
| ·一般聚类算法概述 | 第63-66页 |
| ·分层法 | 第63-64页 |
| ·划分法 | 第64-65页 |
| ·基于密度的方法 | 第65-66页 |
| ·基于网格的方法 | 第66页 |
| ·高维对聚类算法的影响及高维数据聚类方法 | 第66-68页 |
| ·高维对聚类算法效率的影响 | 第67页 |
| ·高维可能导致传统的聚类概念失去意义 | 第67-68页 |
| ·高维数据聚类方法 | 第68页 |
| ·子空间聚类 | 第68-73页 |
| ·重叠划分子空间聚类算法 | 第68-70页 |
| ·无重叠划分子空间聚类算法 | 第70-71页 |
| ·最优投影聚类算法 | 第71-72页 |
| ·子空间聚类算法的推广 | 第72-73页 |
| ·优化的网格分割聚类方法 | 第73-75页 |
| ·优化的网格分割 | 第73-74页 |
| ·优化的网格分割算法 | 第74页 |
| ·优化的网格分割算法性能的改进 | 第74-75页 |
| ·高维类别数据聚类算法 | 第75-76页 |
| ·基于对象相似性的高维数据聚类算法 | 第76-80页 |
| ·基于对象相似性的聚类算法框架 | 第76-77页 |
| ·基于SL树的图分割算法 | 第77-79页 |
| ·HETIS算法 | 第79页 |
| ·应用分析 | 第79-80页 |
| ·本章小结 | 第80-81页 |
| 第七章 高维数据异常检测 | 第81-103页 |
| ·异常检测算法分析 | 第81-86页 |
| ·基于统计的算法 | 第81-82页 |
| ·基于深度的算法 | 第82页 |
| ·基于偏差的算法 | 第82页 |
| ·基于距离的算法 | 第82-84页 |
| ·基于密度的算法 | 第84-86页 |
| ·高维对异常检测算法的影响 | 第86-88页 |
| ·高维对基于统计算法的影响 | 第86-87页 |
| ·高维对基于深度算法的影响 | 第87页 |
| ·高维对基于距离算法的影响 | 第87-88页 |
| ·高维对基于密度算法的影响 | 第88页 |
| ·高维异常检测的问题与出路 | 第88页 |
| ·投影异常的概念及其检测算法 | 第88-93页 |
| ·投影异常的定义 | 第89页 |
| ·蛮力搜索算法 | 第89-90页 |
| ·遗传算法 | 第90-93页 |
| ·动态环境下局部异常的增量挖掘算法INCLOF | 第93-101页 |
| ·受影响对象 | 第93-95页 |
| ·数据插入 | 第95-97页 |
| ·数据删除 | 第97-99页 |
| ·IncLOF的算法复杂度分析 | 第99页 |
| ·性能分析 | 第99-101页 |
| ·本章小结 | 第101-103页 |
| 第八章 总结与展望 | 第103-105页 |
| 参考文献 | 第105-113页 |
| 攻读学位期间作者的工作成果 | 第113-114页 |
| 致谢 | 第114-115页 |