致谢 | 第1-6页 |
摘要 | 第6-9页 |
Abstract | 第9-27页 |
图表目录 | 第27-30页 |
第一章 引言 | 第30-35页 |
一、英语专业四级考试作文评阅的简单历史回顾 | 第30-31页 |
二、英语专业四级考试作文评阅的改革:网上评阅 | 第31页 |
三、网阅环境下的英语专业四级考试作文评分员偏颇研究的意义 | 第31-33页 |
四、网阅环境下的 TEM 4 作文评分员偏颇研究的目的与论文框架 | 第33-34页 |
五、本章小结 | 第34-35页 |
第二章 文献回顾 | 第35-72页 |
一、英语作为二语写作测试研究的历史和现状 | 第35-46页 |
(一) ESL 写作测试的设计 | 第35-37页 |
(二) ESL 写作测试的评阅 | 第37-41页 |
1.ESL 写作测试的评阅方式 | 第37-39页 |
2.ESL 写作测试评阅研究 | 第39-41页 |
(三) ESL 写作测试的评阅标准设计 | 第41-46页 |
二、作文评分员行为研究的历史和现状以及多侧面 Rasch 模型的应用 | 第46-53页 |
(一) 作文评分员行为研究的历史和现状 | 第46-49页 |
1. 作文评分员行为研究的必要性 | 第46-47页 |
2. 评分员效应研究 | 第47-48页 |
3. 评分员效应的延伸研究 | 第48-49页 |
(二) 多侧面 Rasch 模型在做事测试中的应用 | 第49-53页 |
1. 做事测试的特性 | 第49-50页 |
2. 概化理论和多侧面 Rasch 模型 | 第50-52页 |
3. 多侧面 Rasch 模型的应用 | 第52-53页 |
三、作文评分员偏颇研究的历史和现状 | 第53-61页 |
(一) 评分员与评分项目的交互作用 | 第54-55页 |
(二) 评分员与考生背景(教育背景/性别/种族)的交互作用 | 第55-56页 |
(三) 评分员与阅读方式、评判关注点、评判策略的交互作用 | 第56-57页 |
(四) 评分员与评分员背景的交互作用 | 第57-60页 |
(五) 评分员与评分时段的交互作用 | 第60-61页 |
(六) 评分员偏颇分析与评分员培训 | 第61页 |
四、作文评分员培训研究 | 第61-67页 |
(一) 作文评分员培训主要方法的研究 | 第61-64页 |
1. 先期培训 | 第62-63页 |
2. 持续培训 | 第63页 |
3. 行为驱动培训与图式驱动培训 | 第63-64页 |
(二) 作文评分员培训效果的研究 | 第64-66页 |
(三) 作文评分员培训的主要挑战 | 第66-67页 |
1. 评分员团队的组成 | 第66页 |
2. 评分进度的因素 | 第66页 |
3. 评分员培训的临时性 | 第66-67页 |
五、国内外大规模标准考试作文网上评阅的研究现状 | 第67-71页 |
(一) 国内大规模标准考试作文网上评阅的研究现状 | 第67-70页 |
1. 网阅的定义与发展回顾 | 第67页 |
2. 对网阅的研究 | 第67-68页 |
3. 英语专业四级考试作文网上阅卷 | 第68-70页 |
(二) 国外大规模标准考试作文网上评阅的研究现状 | 第70-71页 |
1.ETS的OSN(Online Scoring Network) | 第70页 |
2.UCLES的ESM(Electronic Script Management/Marking) | 第70-71页 |
六、本章小结 | 第71-72页 |
第三章 研究方法 | 第72-82页 |
一、研究框架 | 第72-73页 |
(一) 研究方案 | 第72-73页 |
(二) 研究假设 | 第73页 |
二、研究设计 | 第73-81页 |
(一) 研究对象 | 第74页 |
(二) 数据收集 | 第74-79页 |
1. 问卷调查数据收集基本概况 | 第74-76页 |
2. 评阅数据收集基本概况 | 第76-78页 |
3. 对比实验数据收集基本概况 | 第78-79页 |
(三) 研究工具 | 第79-81页 |
三、本章小结 | 第81-82页 |
第四章 研究结果 | 第82-114页 |
一、定性研究统计结果 | 第82-84页 |
(一) TEM 4 作文评分员背景调查 | 第82页 |
(二) TEM 4 作文评分员对网阅的评价 | 第82-83页 |
(三) TEM 4 作文评分员对网阅培训的评价 | 第83-84页 |
二、采用多侧面 Rasch 模型分析的定量研究统计结果 | 第84-113页 |
(一) 网阅环境下TEM 4 作文评分员偏颇体现方面 | 第84-93页 |
1. 考生刻面 | 第86-87页 |
2. 评分员刻面 | 第87-89页 |
3. 评分项目刻面 | 第89-93页 |
(二) 网阅环境下作文评分员与多刻面的交互作用 | 第93-97页 |
1. 评分员和评分子项目的交互作用 | 第93-95页 |
2. 评分员和考生的交互作用 | 第95-97页 |
(三) 网阅环境下作文评分员的培训与评分员偏颇 | 第97-105页 |
1. 网阅培训与减少作文评分员总体宽松/严厉度的差异 | 第97-99页 |
2. 网阅培训与增强作文评分员自身的内部一致性 | 第99-100页 |
3. 网阅培训与减少作文评分员针对某些评分项目的偏颇 | 第100-105页 |
(四) 网阅环境下作文评分与传统模式评分之间的差异 | 第105-113页 |
1. 考生能力估算值在网阅与传统评阅模式下的差异 | 第105-106页 |
2. 评分员总体严厉度在网阅与传统评阅模式下的差异 | 第106-107页 |
3. 评分员自身内部一致性在网阅与传统评阅模式下的差异 | 第107-108页 |
4. 评分员偏颇在网阅与传统评阅模式下的差异 | 第108-113页 |
三、本章小结 | 第113-114页 |
第五章 讨论 | 第114-132页 |
一、网阅环境下TEM 4 作文评分员的偏颇模式 | 第114-121页 |
(一) 针对评分子项目的偏颇 | 第114-120页 |
(二) 针对考生的偏颇 | 第120-121页 |
二、网阅环境下TEM 4 作文评分员的培训模式与效果 | 第121-129页 |
(一) 现行网阅培训的效果 | 第122-126页 |
(二) 提升网阅培训的效果 | 第126-129页 |
三、网阅环境下 TEM 4 作文评阅的优势 | 第129-130页 |
(一) 网阅与区分考生能力 | 第129页 |
(二) 网阅与评分员总体严厉度 | 第129页 |
(三) 网阅与评分员自身内部一致性 | 第129页 |
(四) 网阅与评分员偏颇 | 第129-130页 |
四、本章小结 | 第130-132页 |
第六章 结语 | 第132-135页 |
参考文献 | 第135-144页 |
附录1 | 第144-147页 |
附录2 | 第147-170页 |
附录3 | 第170-171页 |
附录4 | 第171-172页 |
附录5 | 第172-175页 |
附录6 | 第175-176页 |
附录7 | 第176-178页 |
附录8 | 第178-179页 |
附录9 | 第179-180页 |
附录10 | 第180-181页 |
附录11 | 第181-182页 |