Abstract | 第4-5页 |
摘要 | 第6-10页 |
Table of Contents | 第10-12页 |
List of Abbreviations | 第12-13页 |
List of Figures | 第13-14页 |
List of Tables | 第14-15页 |
Chapter 1 Introduction | 第15-19页 |
1.1 Motivation | 第15页 |
1.2 Research Objectives | 第15页 |
1.3 Introduction to Data Classification | 第15-16页 |
1.4. Classification Techniques | 第16-17页 |
1.5 Introduction to the Missingness of Data | 第17页 |
1.6 Expectation Maximization Algorithm | 第17页 |
1.7 Structure of the Thesis | 第17-19页 |
Chapter 2 Data Missingness and Supervised Classification Techniques | 第19-28页 |
2.1 Missing Completely At Random(MCAR) | 第19页 |
2.2 Missing At Random(MAR) | 第19-20页 |
2.3 Missing Not at Random(MNAR) | 第20-21页 |
2.4 Supervised Classification Techniques | 第21-28页 |
2.4.1 Naive Bayes Classification | 第21-23页 |
2.4.2 Decision Trees | 第23-27页 |
2.4.2.1 Steps in Mining with Decision Trees | 第24-25页 |
2.4.2.2 Attribute Selection | 第25-26页 |
2.4.2.3 Advantages of Decision Trees | 第26页 |
2.4.2.4 Applications of Decision Trees | 第26-27页 |
2.4.3 Lazy Learning Classification | 第27-28页 |
2.4.3.1 Introduction to Lazy Learning | 第27页 |
2.4.3.2 Instance-based typical approaches | 第27-28页 |
Chapter 3 EM-Based Bayesian Network Imputation | 第28-38页 |
3.1 Problem Statement | 第28-29页 |
3.2 Data Imputation Methods | 第29-30页 |
3.2.1 Mean Imputation | 第29-30页 |
3.2.2 Hot Deck Imputation | 第30页 |
3.2.3 Cold Deck Imputation | 第30页 |
3.2.4 K -Nearest Neighbour Imputation | 第30页 |
3.3 The Expectation Maximization algorithm | 第30-31页 |
3.4 Theory of Our Algorithm | 第31-33页 |
3.5. Our Expectation Maximization Bayesian Network Imputation Algorithm | 第33-38页 |
3.5.1 Introduction | 第33-34页 |
3.5.2 Symbol Definition | 第34-35页 |
3.5.3 Algorithm Description and Analysis | 第35-36页 |
3.5.4 Pseudocode of EBN Imputation Algorithm | 第36-38页 |
Chapter 4:Experimental Design and Analysis of Results | 第38-48页 |
4.1 Implementing the EBN Algorithm | 第38页 |
4.2. Methodological experimental approach | 第38-39页 |
4.3 Selection and Setup of Training and Testing Datasets | 第39-40页 |
4.3.1 Choosing UCI Repository Datasets and other Datasets | 第39-40页 |
4.3.2 Introduction of different missing rates | 第40页 |
4.4 EBN Evaluation | 第40-46页 |
4.4.1 Evaluating EBN using the Four Original Datasets | 第41-43页 |
4.4.2 Evaluating EBN using Different Missingness of Data Rates | 第43-46页 |
4.5 Discussions | 第46-48页 |
Chapter 5 Conclusion and Future Work | 第48-50页 |
5.1 Conclusion and Contribution | 第48-49页 |
5.2 Future Work | 第49-50页 |
Acknowledgment | 第50-51页 |
References | 第51-56页 |
Appendix:List of publication and achievements | 第56页 |