等级反应多水平侧面模型及其在主观题评分中的应用

摘要	第3-5页
ABSTRACT	第5-7页
前言	第14-15页
1 文献综述	第15-32页
1.1 概念界定	第15-20页
1.1.1 主观题	第15-16页
1.1.2 主观评分	第16页
1.1.3 主观评分的应用	第16-17页
1.1.4 评分者信度	第17页
1.1.5 评分者效应	第17-20页
1.1.6 评分者效应研究思路	第20页
1.2 评分者效应影响因素	第20-23页
1.2.1 评分者的目标	第21页
1.2.2 评分者对评分标准的理解	第21-22页
1.2.3 培训经历	第22页
1.2.4 人格特质及其它因素	第22-23页
1.3 评分者效应研究方法	第23-32页
1.3.1 经典测量理论	第23-24页
1.3.2 概化理论	第24-27页
1.3.3 多面Rasch模型	第27页
1.3.4 多水平随机系数模型	第27-30页
1.3.5 广义多水平多侧面模型	第30-32页
2 问题提出和研究设计	第32-38页
2.1 有方法的不足	第32-35页
2.1.1 CTT无法估计评分者具体效应	第32-33页
2.1.2 GT和IRT方法无法检测评分者影响因素	第33页
2.1.3 多水平随机系数模型无法估计评分者宽严度参数	第33-34页
2.1.4 广义多水平侧面模型无法用于呈有序加工特点的项目	第34-35页
2.2 问题提出	第35页
2.3 研究设计	第35-36页
2.3.1 研究目的与内容	第35-36页
2.3.2 整体设计思路	第36页
2.4 研究意义	第36-38页
2.4.1 理论意义	第36页
2.4.2 实践意义	第36-38页
3 等级反应多水平侧面模型的构建	第38-42页
3.1 模型定义	第38-40页
3.2 参数估计	第40-42页
4 研究一：GR-MLFM简单模型的拟合验证	第42-57页
4.1 研究目的	第42页
4.2 研究模型	第42-43页
4.3 研究假设	第43页
4.4 研究方法	第43-47页
4.4.1 模拟设计	第43-44页
4.4.2 数据生成	第44-45页
4.4.3 分析指标	第45-47页
4.5 研究结果	第47-55页
4.5.1 GR-MLFM参数估计值更准确稳定	第47-51页
4.5.2 GR-MLFM的拟合指标优于G-MLFM	第51-55页
4.5.3 GR-MLFM参数估计值显著好于G-MLFM	第55页
4.6 讨论与结论	第55-57页
5 研究二：包含预测变量的等级反应多水平侧面模型研究	第57-67页
5.1 研究目的	第57页
5.2 研究模型	第57页
5.3 研究假设	第57-58页
5.4 研究方法	第58页
5.4.1 研究设计	第58页
5.4.2 数据生成	第58页
5.5 研究结果	第58-65页
5.5.1 模型各参数估计值比较接近真值	第58-62页
5.5.2 大部分参数的拟合指标值表现优良	第62-65页
5.6 讨论与结论	第65-67页
6 研究三：基于等级反应多水平侧面模型的实证研究	第67-83页
6.1 研究目的	第67页
6.2 研究模型	第67-68页
6.3 研究方法及过程	第68-71页
6.3.1 研究工具	第68页
6.3.2 实验材料	第68页
6.3.3 被试及评分者	第68页
6.3.4 研究过程	第68-70页
6.3.5 数据处理	第70-71页
6.4 研究结果	第71-81页
6.4.1 学生参数估计结果	第71-72页
6.4.2 项目参数估计结果	第72-75页
6.4.3 评分者参数估计结果	第75-81页
6.5 讨论与结论	第81-83页
7 综合讨论	第83-89页
7.1 模型的可行性分析	第83-84页
7.2 模型与数据拟合度分析	第84-85页
7.2.1 GR-MLFM和G-MLFM适用于不同任务情境	第84-85页
7.2.2 GR-MLFM可以较好地拟合数据并检测预测变量	第85页
7.3 GR-MLFM在实践情境中的适宜性	第85-87页
7.3.1 学生性别的预测作用不显著	第86页
7.3.2 存在两种类型的评分者系统偏差	第86页
7.3.3 评分者责任心和自信心对宽严度有显著预测作用	第86-87页
7.4 不足与展望	第87-89页
7.4.1 研究不足	第87-88页
7.4.2 研究展望	第88-89页
8 研究结论	第89-90页
9 参考文献	第90-101页
附录	第101-102页
致谢	第102-108页
攻读学位期间取得的研究成果	第108-109页