网阅环境下的英语专业四级考试作文评分员偏颇研究

致谢	第1-6页
摘要	第6-9页
Abstract	第9-27页
图表目录	第27-30页
第一章引言	第30-35页
一、英语专业四级考试作文评阅的简单历史回顾	第30-31页
二、英语专业四级考试作文评阅的改革：网上评阅	第31页
三、网阅环境下的英语专业四级考试作文评分员偏颇研究的意义	第31-33页
四、网阅环境下的 TEM 4 作文评分员偏颇研究的目的与论文框架	第33-34页
五、本章小结	第34-35页
第二章文献回顾	第35-72页
一、英语作为二语写作测试研究的历史和现状	第35-46页
（一） ESL 写作测试的设计	第35-37页
（二） ESL 写作测试的评阅	第37-41页
1.ESL 写作测试的评阅方式	第37-39页
2.ESL 写作测试评阅研究	第39-41页
（三） ESL 写作测试的评阅标准设计	第41-46页
二、作文评分员行为研究的历史和现状以及多侧面 Rasch 模型的应用	第46-53页
（一）作文评分员行为研究的历史和现状	第46-49页
1. 作文评分员行为研究的必要性	第46-47页
2. 评分员效应研究	第47-48页
3. 评分员效应的延伸研究	第48-49页
（二）多侧面 Rasch 模型在做事测试中的应用	第49-53页
1. 做事测试的特性	第49-50页
2. 概化理论和多侧面 Rasch 模型	第50-52页
3. 多侧面 Rasch 模型的应用	第52-53页
三、作文评分员偏颇研究的历史和现状	第53-61页
（一）评分员与评分项目的交互作用	第54-55页
（二）评分员与考生背景(教育背景/性别/种族)的交互作用	第55-56页
（三）评分员与阅读方式、评判关注点、评判策略的交互作用	第56-57页
（四）评分员与评分员背景的交互作用	第57-60页
（五）评分员与评分时段的交互作用	第60-61页
（六）评分员偏颇分析与评分员培训	第61页
四、作文评分员培训研究	第61-67页
（一）作文评分员培训主要方法的研究	第61-64页
1. 先期培训	第62-63页
2. 持续培训	第63页
3. 行为驱动培训与图式驱动培训	第63-64页
（二）作文评分员培训效果的研究	第64-66页
（三）作文评分员培训的主要挑战	第66-67页
1. 评分员团队的组成	第66页
2. 评分进度的因素	第66页
3. 评分员培训的临时性	第66-67页
五、国内外大规模标准考试作文网上评阅的研究现状	第67-71页
（一）国内大规模标准考试作文网上评阅的研究现状	第67-70页
1. 网阅的定义与发展回顾	第67页
2. 对网阅的研究	第67-68页
3. 英语专业四级考试作文网上阅卷	第68-70页
（二）国外大规模标准考试作文网上评阅的研究现状	第70-71页
1.ETS的OSN（Online Scoring Network）	第70页
2.UCLES的ESM(Electronic Script Management/Marking)	第70-71页
六、本章小结	第71-72页
第三章研究方法	第72-82页
一、研究框架	第72-73页
（一）研究方案	第72-73页
（二）研究假设	第73页
二、研究设计	第73-81页
（一）研究对象	第74页
（二）数据收集	第74-79页
1. 问卷调查数据收集基本概况	第74-76页
2. 评阅数据收集基本概况	第76-78页
3. 对比实验数据收集基本概况	第78-79页
（三）研究工具	第79-81页
三、本章小结	第81-82页
第四章研究结果	第82-114页
一、定性研究统计结果	第82-84页
（一） TEM 4 作文评分员背景调查	第82页
（二） TEM 4 作文评分员对网阅的评价	第82-83页
（三） TEM 4 作文评分员对网阅培训的评价	第83-84页
二、采用多侧面 Rasch 模型分析的定量研究统计结果	第84-113页
（一）网阅环境下TEM 4 作文评分员偏颇体现方面	第84-93页
1. 考生刻面	第86-87页
2. 评分员刻面	第87-89页
3. 评分项目刻面	第89-93页
（二）网阅环境下作文评分员与多刻面的交互作用	第93-97页
1. 评分员和评分子项目的交互作用	第93-95页
2. 评分员和考生的交互作用	第95-97页
（三）网阅环境下作文评分员的培训与评分员偏颇	第97-105页
1. 网阅培训与减少作文评分员总体宽松/严厉度的差异	第97-99页
2. 网阅培训与增强作文评分员自身的内部一致性	第99-100页
3. 网阅培训与减少作文评分员针对某些评分项目的偏颇	第100-105页
（四）网阅环境下作文评分与传统模式评分之间的差异	第105-113页
1. 考生能力估算值在网阅与传统评阅模式下的差异	第105-106页
2. 评分员总体严厉度在网阅与传统评阅模式下的差异	第106-107页
3. 评分员自身内部一致性在网阅与传统评阅模式下的差异	第107-108页
4. 评分员偏颇在网阅与传统评阅模式下的差异	第108-113页
三、本章小结	第113-114页
第五章讨论	第114-132页
一、网阅环境下TEM 4 作文评分员的偏颇模式	第114-121页
(一) 针对评分子项目的偏颇	第114-120页
(二) 针对考生的偏颇	第120-121页
二、网阅环境下TEM 4 作文评分员的培训模式与效果	第121-129页
（一）现行网阅培训的效果	第122-126页
（二）提升网阅培训的效果	第126-129页
三、网阅环境下 TEM 4 作文评阅的优势	第129-130页
（一）网阅与区分考生能力	第129页
（二）网阅与评分员总体严厉度	第129页
（三）网阅与评分员自身内部一致性	第129页
（四）网阅与评分员偏颇	第129-130页
四、本章小结	第130-132页
第六章结语	第132-135页
参考文献	第135-144页
附录1	第144-147页
附录2	第147-170页
附录3	第170-171页
附录4	第171-172页
附录5	第172-175页
附录6	第175-176页
附录7	第176-178页
附录8	第178-179页
附录9	第179-180页
附录10	第180-181页
附录11	第181-182页