ABSTRACT | 第4页 |
摘要 | 第5-8页 |
CHAPTER 1 INTRODUCTION | 第8-14页 |
1.1 BACKGROUND | 第8页 |
1.2 RESEARCH SIGNIFICANCE | 第8-9页 |
1.3 RELATED WORK | 第9页 |
1.4 PROBLEM DESCRIPTION AND DEFINITION | 第9-11页 |
1.4.1 Air Quality Index (AQI) | 第9-10页 |
1.4.2 Meteorological Data | 第10页 |
1.4.3 Region of Interest (ROI) | 第10页 |
1.4.4 Problem Formulation | 第10-11页 |
1.5 OUTLINE AND CONTRIBUTIONS | 第11-12页 |
1.5.1 Outline | 第11页 |
1.5.2 Contributions | 第11-12页 |
1.6 ORGANIZATION OF THESIS | 第12-14页 |
CHAPTER 2 DATA PREPARATION AND FEATURE EXTRACTION | 第14-28页 |
2.1 DATA OVERVIEW | 第14-15页 |
2.2 DATA COLLECTION | 第15-16页 |
2.2.1 PM_(2.5) Data Collection | 第15页 |
2.2.2 Meteorological Data Collection | 第15-16页 |
2.3 DATA PROCESSING | 第16-22页 |
2.3.1 PM_(2.5)Data Processing | 第16-17页 |
2.3.2 Met Data Processing | 第17-18页 |
2.3.3 Data Merging | 第18-19页 |
2.3.4 Discretization | 第19页 |
2.3.5 Normalization | 第19-20页 |
2.3.6 Predictor Variables | 第20-21页 |
2.3.7 Prediction Models | 第21页 |
2.3.8 Training and Test Sets | 第21页 |
2.3.9 Data formatting | 第21-22页 |
2.4 DATA CORRELATION ANALYSIS | 第22-25页 |
2.4.1 PM_(2.5) and Temperature | 第22-23页 |
2.4.2 PM_(2.5) and Atmospheric Pressure | 第23-24页 |
2.4.3 PM_(2.5) and Humidity | 第24页 |
2.4.4 PM_(2.5) and Wind speed | 第24-25页 |
2.5 FINAL DATASET OVERVIEW | 第25-28页 |
CHAPTER 3 METHODOLOGY | 第28-38页 |
3.1 CLASSIFICATION | 第28页 |
3.1.1 Definition | 第28页 |
3.1.2 Multi-label Classification | 第28页 |
3.2 CLASSIFICATION ALGORITHMS | 第28-33页 |
3.2.1 Naive Bayes | 第28-30页 |
3.2.2 Multinomial Logistic Regression | 第30页 |
3.2.3 Sequential Minimal Optimization (SMO) | 第30-32页 |
3.2.4 k-Nearest Neighbor (k-NN) | 第32-33页 |
3.2.5 Random Subspace | 第33页 |
3.3 DATA SPLITTING | 第33-35页 |
3.3.1 Cross-validation (CV) | 第34-35页 |
3.4 PERFORMANCE DIMENSIONS | 第35-37页 |
3.4.1 Classification performance | 第35-37页 |
3.5 SOFTWARE PACKAGES | 第37-38页 |
3.5.1 WEKA | 第37页 |
3.5.2 R Studio | 第37-38页 |
CHAPTER 4. EXPERIMENTS AND RESULTS | 第38-60页 |
4.1 CLASSIFICATION ALGORITHM PARAMETER SELECTION | 第38-47页 |
4.1.1 Naive Bayes | 第38-40页 |
4.1.2 Multinomial Logistic Regression | 第40-42页 |
4.1.3 SMO | 第42-43页 |
4.1.4 IBk | 第43-45页 |
4.1.5 RandomSubSpace | 第45-47页 |
4.1.6 Discussion | 第47页 |
4.2 DATA SPLITTING | 第47-52页 |
4.2.1 Cross Validation | 第47-49页 |
4.2.2 Random Percentage Split | 第49-50页 |
4.2.3 Order-Preserved Percentage Split | 第50-51页 |
4.2.4 Discussion | 第51-52页 |
4.3 PREDICTION MODELS | 第52-54页 |
4.3.1 Results | 第52-54页 |
4.3.2 Discussion | 第54页 |
4.4 METEOROLOGICAL FACTORS SELECTION | 第54-57页 |
4.4.1 Temperature | 第55页 |
4.4.2 Atmospheric Pressure | 第55页 |
4.4.3 Humidity | 第55-56页 |
4.4.4 Wind Speed | 第56页 |
4.4.5 Discussion | 第56-57页 |
4.5 CASE STUDY | 第57-60页 |
4.5.1 Results | 第57-58页 |
4.5.2 Discussion | 第58-60页 |
CHAPTER 5 CONCLUSION AND FUTURE WORK | 第60-62页 |
5.1 CONCLUSION | 第60-61页 |
5.2 FUTURE WORK | 第61-62页 |
REFERENCES | 第62-64页 |
发表论文和参加科研情况 | 第64-65页 |
ACKNOWLEDGEMENTS | 第65页 |