摘要 | 第4-5页 |
Abstract | 第5页 |
Chapter 1. Introduction | 第8-14页 |
1.1 Research significance and purpose | 第8-9页 |
1.2 Research status and level | 第9-12页 |
1.2.1 Current research status | 第9-12页 |
1.2.2 Present problems in the field and proposed solution | 第12页 |
1.3 Structure | 第12-13页 |
1.4 Summary | 第13-14页 |
Chapter 2. Supervised Learning | 第14-28页 |
2.1 Supervised learning | 第14-15页 |
2.2 Main algorithms of supervised learning | 第15-20页 |
2.2.1 Gradient Boosting | 第16页 |
2.2.2 Random Forests | 第16-17页 |
2.2.3 Extremely Randomized Trees | 第17-18页 |
2.2.4 AdaBoost | 第18-19页 |
2.2.5 Neural Networks | 第19-20页 |
2.3 Naive Bayes classiifer | 第20-24页 |
2.4 R statistical programming language | 第24-26页 |
2.5 Python | 第26-27页 |
2.6 Summary | 第27-28页 |
Chapter 3 Data Preprocessing | 第28-44页 |
3.1 Use of Data Preprocessing Techniques | 第28-35页 |
3.2 The overall workflow | 第35-38页 |
3.2.1 Feature engineering | 第35-36页 |
3.2.2 Preprocessing the data | 第36-38页 |
3.3 Visualization | 第38-43页 |
3.3.1 Clusters of stations | 第38-40页 |
3.3.2 Energy distribution by year | 第40-43页 |
3.4 Summary | 第43-44页 |
Chapter 4 Choosing the best algorithm in use validation | 第44-61页 |
4.1 Use of three algorithms | 第44-47页 |
4.2 Experiment process | 第47-56页 |
4.2.1 Task description | 第52-53页 |
4.2.2 The overall workflow | 第53-56页 |
4.2.3 Comparison of 3 algorithms | 第56页 |
4.2.4 Experiment results | 第56页 |
4.3 Training and test on a UCI dataset | 第56-60页 |
4.4 Summary | 第60-61页 |
Chapter 5 Conclusion and future works | 第61-62页 |
Reference | 第62-67页 |
Acknowledgement | 第67页 |