摘要 | 第3-5页 |
ABSTRACT | 第5-7页 |
前言 | 第14-15页 |
1 文献综述 | 第15-32页 |
1.1 概念界定 | 第15-20页 |
1.1.1 主观题 | 第15-16页 |
1.1.2 主观评分 | 第16页 |
1.1.3 主观评分的应用 | 第16-17页 |
1.1.4 评分者信度 | 第17页 |
1.1.5 评分者效应 | 第17-20页 |
1.1.6 评分者效应研究思路 | 第20页 |
1.2 评分者效应影响因素 | 第20-23页 |
1.2.1 评分者的目标 | 第21页 |
1.2.2 评分者对评分标准的理解 | 第21-22页 |
1.2.3 培训经历 | 第22页 |
1.2.4 人格特质及其它因素 | 第22-23页 |
1.3 评分者效应研究方法 | 第23-32页 |
1.3.1 经典测量理论 | 第23-24页 |
1.3.2 概化理论 | 第24-27页 |
1.3.3 多面Rasch模型 | 第27页 |
1.3.4 多水平随机系数模型 | 第27-30页 |
1.3.5 广义多水平多侧面模型 | 第30-32页 |
2 问题提出和研究设计 | 第32-38页 |
2.1 有方法的不足 | 第32-35页 |
2.1.1 CTT无法估计评分者具体效应 | 第32-33页 |
2.1.2 GT和IRT方法无法检测评分者影响因素 | 第33页 |
2.1.3 多水平随机系数模型无法估计评分者宽严度参数 | 第33-34页 |
2.1.4 广义多水平侧面模型无法用于呈有序加工特点的项目 | 第34-35页 |
2.2 问题提出 | 第35页 |
2.3 研究设计 | 第35-36页 |
2.3.1 研究目的与内容 | 第35-36页 |
2.3.2 整体设计思路 | 第36页 |
2.4 研究意义 | 第36-38页 |
2.4.1 理论意义 | 第36页 |
2.4.2 实践意义 | 第36-38页 |
3 等级反应多水平侧面模型的构建 | 第38-42页 |
3.1 模型定义 | 第38-40页 |
3.2 参数估计 | 第40-42页 |
4 研究一:GR-MLFM简单模型的拟合验证 | 第42-57页 |
4.1 研究目的 | 第42页 |
4.2 研究模型 | 第42-43页 |
4.3 研究假设 | 第43页 |
4.4 研究方法 | 第43-47页 |
4.4.1 模拟设计 | 第43-44页 |
4.4.2 数据生成 | 第44-45页 |
4.4.3 分析指标 | 第45-47页 |
4.5 研究结果 | 第47-55页 |
4.5.1 GR-MLFM参数估计值更准确稳定 | 第47-51页 |
4.5.2 GR-MLFM的拟合指标优于G-MLFM | 第51-55页 |
4.5.3 GR-MLFM参数估计值显著好于G-MLFM | 第55页 |
4.6 讨论与结论 | 第55-57页 |
5 研究二:包含预测变量的等级反应多水平侧面模型研究 | 第57-67页 |
5.1 研究目的 | 第57页 |
5.2 研究模型 | 第57页 |
5.3 研究假设 | 第57-58页 |
5.4 研究方法 | 第58页 |
5.4.1 研究设计 | 第58页 |
5.4.2 数据生成 | 第58页 |
5.5 研究结果 | 第58-65页 |
5.5.1 模型各参数估计值比较接近真值 | 第58-62页 |
5.5.2 大部分参数的拟合指标值表现优良 | 第62-65页 |
5.6 讨论与结论 | 第65-67页 |
6 研究三:基于等级反应多水平侧面模型的实证研究 | 第67-83页 |
6.1 研究目的 | 第67页 |
6.2 研究模型 | 第67-68页 |
6.3 研究方法及过程 | 第68-71页 |
6.3.1 研究工具 | 第68页 |
6.3.2 实验材料 | 第68页 |
6.3.3 被试及评分者 | 第68页 |
6.3.4 研究过程 | 第68-70页 |
6.3.5 数据处理 | 第70-71页 |
6.4 研究结果 | 第71-81页 |
6.4.1 学生参数估计结果 | 第71-72页 |
6.4.2 项目参数估计结果 | 第72-75页 |
6.4.3 评分者参数估计结果 | 第75-81页 |
6.5 讨论与结论 | 第81-83页 |
7 综合讨论 | 第83-89页 |
7.1 模型的可行性分析 | 第83-84页 |
7.2 模型与数据拟合度分析 | 第84-85页 |
7.2.1 GR-MLFM和G-MLFM适用于不同任务情境 | 第84-85页 |
7.2.2 GR-MLFM可以较好地拟合数据并检测预测变量 | 第85页 |
7.3 GR-MLFM在实践情境中的适宜性 | 第85-87页 |
7.3.1 学生性别的预测作用不显著 | 第86页 |
7.3.2 存在两种类型的评分者系统偏差 | 第86页 |
7.3.3 评分者责任心和自信心对宽严度有显著预测作用 | 第86-87页 |
7.4 不足与展望 | 第87-89页 |
7.4.1 研究不足 | 第87-88页 |
7.4.2 研究展望 | 第88-89页 |
8 研究结论 | 第89-90页 |
9 参考文献 | 第90-101页 |
附录 | 第101-102页 |
致谢 | 第102-108页 |
攻读学位期间取得的研究成果 | 第108-109页 |