| 摘要 | 第4-5页 |
| Abstract | 第5页 |
| Chapter 1. Introduction | 第8-14页 |
| 1.1 Research significance and purpose | 第8-9页 |
| 1.2 Research status and level | 第9-12页 |
| 1.2.1 Current research status | 第9-12页 |
| 1.2.2 Present problems in the field and proposed solution | 第12页 |
| 1.3 Structure | 第12-13页 |
| 1.4 Summary | 第13-14页 |
| Chapter 2. Supervised Learning | 第14-28页 |
| 2.1 Supervised learning | 第14-15页 |
| 2.2 Main algorithms of supervised learning | 第15-20页 |
| 2.2.1 Gradient Boosting | 第16页 |
| 2.2.2 Random Forests | 第16-17页 |
| 2.2.3 Extremely Randomized Trees | 第17-18页 |
| 2.2.4 AdaBoost | 第18-19页 |
| 2.2.5 Neural Networks | 第19-20页 |
| 2.3 Naive Bayes classiifer | 第20-24页 |
| 2.4 R statistical programming language | 第24-26页 |
| 2.5 Python | 第26-27页 |
| 2.6 Summary | 第27-28页 |
| Chapter 3 Data Preprocessing | 第28-44页 |
| 3.1 Use of Data Preprocessing Techniques | 第28-35页 |
| 3.2 The overall workflow | 第35-38页 |
| 3.2.1 Feature engineering | 第35-36页 |
| 3.2.2 Preprocessing the data | 第36-38页 |
| 3.3 Visualization | 第38-43页 |
| 3.3.1 Clusters of stations | 第38-40页 |
| 3.3.2 Energy distribution by year | 第40-43页 |
| 3.4 Summary | 第43-44页 |
| Chapter 4 Choosing the best algorithm in use validation | 第44-61页 |
| 4.1 Use of three algorithms | 第44-47页 |
| 4.2 Experiment process | 第47-56页 |
| 4.2.1 Task description | 第52-53页 |
| 4.2.2 The overall workflow | 第53-56页 |
| 4.2.3 Comparison of 3 algorithms | 第56页 |
| 4.2.4 Experiment results | 第56页 |
| 4.3 Training and test on a UCI dataset | 第56-60页 |
| 4.4 Summary | 第60-61页 |
| Chapter 5 Conclusion and future works | 第61-62页 |
| Reference | 第62-67页 |
| Acknowledgement | 第67页 |