| 摘要 | 第1-6页 |
| Abstract | 第6-13页 |
| Chapter 1 Introduction | 第13-16页 |
| ·Research Background | 第13-14页 |
| ·Key Research Questions | 第14页 |
| ·Significance of the Research | 第14页 |
| ·Organization of the Thesis | 第14-16页 |
| Chapter 2 Literature Review | 第16-23页 |
| ·An Overview of Oral Speaking Test | 第16-19页 |
| ·Relevant Research on Raters' Reliability | 第19-22页 |
| ·Correlation and Percentage of Inter-rater Reliability | 第20页 |
| ·Serial Correlation Method | 第20页 |
| ·Generalizability Theory | 第20-21页 |
| ·The Advantages of Adopting GT | 第21-22页 |
| ·CEPT and its Practicality | 第22-23页 |
| Chapter 3 Methodology | 第23-27页 |
| ·Participants | 第23页 |
| ·Instruments | 第23-25页 |
| ·Testing Materials | 第23-24页 |
| ·Questionnaire | 第24-25页 |
| ·Experiment Design | 第25-27页 |
| ·Rating Criteria | 第25页 |
| ·The Training of Raters | 第25-27页 |
| Chapter 4 Data Analysis | 第27-44页 |
| ·Quantitative Analysis | 第28-37页 |
| ·Frequency Analysis | 第29-33页 |
| ·Item Correlations | 第33-34页 |
| ·Item Difficulty and Discrimination Index | 第34-35页 |
| ·Inter-rater and Intra-rater Reliability Coefficient | 第35-37页 |
| ·Further Analysis of Generalizability Analysis | 第37-44页 |
| ·G-Study | 第37-38页 |
| ·D-Study | 第38-44页 |
| Chapter 5 Results and Discussion | 第44-50页 |
| ·Discussion of the First Question | 第44-45页 |
| ·Discussion of the Second Question | 第45页 |
| ·Discussion of the Third Question | 第45-46页 |
| ·Discussion of the Fourth Question | 第46页 |
| ·Feedback of Questionnaire for Raters | 第46-50页 |
| ·Investigation for Background of Raters | 第46-47页 |
| ·Investigation for Rating Criteria | 第47-48页 |
| ·Investigation for Item Analysis | 第48-49页 |
| ·Investigation for Related Comments | 第49-50页 |
| Conclusion | 第50-53页 |
| Reference | 第53-59页 |
| Appendix B Rating criteria of CEPT speaking test | 第59-60页 |
| Appendix C Questionnaire for raters after training | 第60-62页 |
| Appendix D 详细中文摘要 | 第62-65页 |
| Acknowledgements | 第65页 |