摘要 | 第4-5页 |
Abstract | 第5-6页 |
Chapter 1 Introduction | 第18-30页 |
1.1 Motivation | 第19-20页 |
1.2 Research problems | 第20-23页 |
1.3 Research objectives and contributions | 第23-25页 |
1.4 Thesis organization | 第25-30页 |
Chapter 2 Background and Preliminaries | 第30-42页 |
2.1 Background | 第30-38页 |
2.1.1 Data clustering | 第31-32页 |
2.1.2 Identifying the number of clusters | 第32-33页 |
2.1.3 Selection of initial cluster centers | 第33-34页 |
2.1.4 Pairwise constraints | 第34页 |
2.1.5 Semi-supervised clustering | 第34-35页 |
2.1.6 Data stream clustering | 第35-36页 |
2.1.7 Concept drift | 第36-37页 |
2.1.8 Survival analysis | 第37页 |
2.1.9 Ensemble clustering | 第37-38页 |
2.2 Preliminaries | 第38-41页 |
2.2.1 Gamma mixture model (GMM) | 第38-39页 |
2.2.2 Expectation-maximization (EM) algorithm | 第39-40页 |
2.2.3 Second-order Akaike information criterion (AICc) | 第40-41页 |
2.2.4 k-means algorithm | 第41页 |
2.3 Summary | 第41-42页 |
Chapter 3 I-nice: A New Approach for Clustering | 第42-82页 |
3.1 Introduction | 第42-46页 |
3.2 Related work | 第46-47页 |
3.3 I-nice method and I-nice SO algorithm | 第47-57页 |
3.3.1 Distance distributions of observation points | 第48页 |
3.3.2 Model distance distributions with a GMM | 第48-49页 |
3.3.3 Solve the GMM with EM | 第49-53页 |
3.3.4 Select the best-fitted GMM with AICc | 第53-54页 |
3.3.5 Determine the number of clusters in the data | 第54页 |
3.3.6 Select the initial cluster centers | 第54-55页 |
3.3.7 I-nice SO algorithm | 第55-57页 |
3.4 I-nice MO: I-nice with multiple observation points | 第57-63页 |
3.4.1 Method for combining the results of multiple GMMs | 第57-61页 |
3.4.2 Select the initial cluster centers | 第61页 |
3.4.3 Determine the final set of initial cluster centers | 第61-62页 |
3.4.4 Determine the number of clusters | 第62-63页 |
3.4.5 I-nice MO algorithm | 第63页 |
3.5 Complexity analysis of the I-nice algorithms | 第63-64页 |
3.6 Experiments | 第64-80页 |
3.6.1 Datasets | 第64-66页 |
3.6.2 Experimental settings and evaluation methods | 第66-69页 |
3.6.3 Experimental results and analysis | 第69-80页 |
3.6.3.1 Performance in terms of finding the correct number of clusters | 第70-73页 |
3.6.3.2 Performance in terms of improvement of clustering with I-nice-identified initial cluster centers | 第73-80页 |
3.7 Summary | 第80-82页 |
Chapter 4 I-nice based Semi-supervised Clustering from Unlabeled Data | 第82-112页 |
4.1 Introduction | 第82-84页 |
4.2 Related work | 第84-86页 |
4.3 Overview of methodology | 第86-87页 |
4.4 Generate pairwise constraints from unlabeled data | 第87-93页 |
4.4.1 Estimate initial clusters | 第88页 |
4.4.2 Generate dense groups from initial clusters | 第88-89页 |
4.4.3 Select must-link and cannot-link constraints | 第89-93页 |
4.5 Semi-supervised clustering for unlabeled data | 第93-97页 |
4.5.1 Generation of pairwise constraints from unlabeled data | 第93-94页 |
4.5.2 Semi-supervised clustering process | 第94-96页 |
4.5.3 Complexity analysis | 第96-97页 |
4.6 Experiments | 第97-109页 |
4.6.1 Experimental setup | 第97-100页 |
4.6.1.1 Datasets | 第97-98页 |
4.6.1.2 Experimental settings | 第98页 |
4.6.1.3 Evaluation criteria | 第98-99页 |
4.6.1.4 Competing methods | 第99-100页 |
4.6.2 Experimental results and analysis | 第100-109页 |
4.6.2.1 Performance of the I-nice method to estimate the ini-tial clusters | 第100-101页 |
4.6.2.2 Selection of pairwise constraints | 第101-104页 |
4.6.2.3 Performance in terms of improvement of clustering on synthetic datasets | 第104-105页 |
4.6.2.4 Performance in terms of improvement of clustering on real-world datasets | 第105-109页 |
4.7 Summary | 第109-112页 |
Chapter 5 I-nice based Concept Drift Detection for Cluster Survival Analysis | 第112-142页 |
5.1 Introduction | 第113-116页 |
5.2 Related work | 第116-118页 |
5.3 Problem formulation | 第118-121页 |
5.4 Concept drift detection for cluster survival analysis | 第121-128页 |
5.4.1 I-nice Stream: A data stream clustering algorithm | 第121-122页 |
5.4.2 Concept drift detection | 第122-125页 |
5.4.3 Cluster survival analysis | 第125-128页 |
5.4.3.1 Categorize the clustering patterns | 第125-126页 |
5.4.3.2 Survival analysis of clustering patterns among windows | 第126-128页 |
5.5 Complexity analysis of the concept drift detectionmethod | 第128-129页 |
5.6 Experiments | 第129-140页 |
5.6.1 Experimental setup | 第129-131页 |
5.6.1.1 Datasets | 第129-130页 |
5.6.1.2 Preprocessing of load profile data | 第130页 |
5.6.1.3 Experimental settings | 第130-131页 |
5.6.2 Experimental results and analysis | 第131-140页 |
5.6.2.1 Performance in terms of improvement of clustering with I-nice Stream | 第131-132页 |
5.6.2.2 Identification of clustering patterns among windows | 第132-134页 |
5.6.2.3 Changing behaviors of power consumption patterns | 第134-140页 |
5.7 Summary | 第140-142页 |
Chapter 6 I-nice based Semi-supervised Clustering Ensemble for Load Profile Data Analysis | 第142-168页 |
6.1 Introduction | 第143-145页 |
6.2 Related work | 第145-146页 |
6.3 Semi-supervised clustering ensemble framework | 第146-154页 |
6.3.1 Process load data stream with time horizon | 第146-147页 |
6.3.2 Estimate initial cluster centers with the weighted I-nice method | 第147-149页 |
6.3.2.1 Allocate weighted multiple observation points | 第148页 |
6.3.2.2 Select best-fitted models | 第148页 |
6.3.2.3 Estimate the candidate initial centers | 第148-149页 |
6.3.2.4 Select initial cluster centers | 第149页 |
6.3.3 Semi-supervised clustering | 第149-152页 |
6.3.4 Ensemble of semi-supervised clusterings | 第152-154页 |
6.4 Complexity analysis of semi-supervised ensemble clustering framework | 第154-156页 |
6.5 Experiments | 第156-167页 |
6.5.1 Experimental setup | 第156-159页 |
6.5.1.1 Datasets | 第156-159页 |
6.5.2 Experimental settings and evaluation methods | 第159页 |
6.5.3 Experimental results and analysis | 第159-167页 |
6.5.3.1 Performance in terms of finding the correct number of clusters with theI-nice WMO algorithm | 第160页 |
6.5.3.2 Performance in terms of improvement of clustering with the I-nice WMOalgorithm | 第160-163页 |
6.5.3.3 Performance in terms of improvement of clustering with the ISCE frame-work | 第163-167页 |
6.6 Summary | 第167-168页 |
Chapter 7 Conclusions and Future Work | 第168-172页 |
Bibliography | 第172-190页 |
Acknowledgements | 第190-192页 |
Publications | 第192-193页 |