李俊飞谭顶良

关键词:教育评价改革;增值评价;增值数据;有效反馈

2.1不同增值模型及其数据特征

模型的建构思路和统计方法决定了增值数据的特征。随着统计技术的发展,研究者提出适配于不同场景的各类增值模型,模型采用的统计方法有所不同,因此,增值评价项目需要选择适合的模型[16],并在模型确定的基础上,对不同增值模型的数据特征进行分析。下面选取常见的4种模型进行讨论,包括获得分数模型、多元线性回归模型、多水平回归模型和成长百分比模型。

一是获得分数模型。这是目前比较简单的一种增值模型,利用标准分差值的统计方法,将连续两次的标准化测试成绩之差作为增值量。前后测分数通过标准化处理,获得均值为0、方差为1的标准化分数集Z,使两次不同测试的结果纳入统一的衡量标尺中,公式如下:

二是多元线性回归模型。其利用最小二乘法拟合方程参数,可探究不同因素对增值的影响。多元回归模型不仅可以纳入人口学因素等非教育变量,还可以分析师生特征、教学方式等因素对增值的影响[17]。随着变量逐步纳入方程,通过拟合解释率(R2)和夏普利值(shapleyvalue)可以得到每个自变量对因变量的解释权重,进而估计模型中各变量的相对效应。回归公式如下:

其中,Yi为预测成绩,X1…Xi为初始成绩和人口学因素等变量。预测值与实际值的最小均差平方和,即为残差,代表教师效能。这种方法需要广泛的实证调查,受测量误差和缺失值等方面的影响,增值结果的精准度会有所降低,但得到的数据较为丰富,可对改进教学提供更具体的指导。

三是多水平回归模型。这是目前较为主流的增值模型,将学生前测成绩作为基线分数,前两次及以上成绩作为矫正分数,在学校、教师、学生等多个层次中输入各层相关的协变量,得到相应的效应量。以教师和学生的2水平回归模型为例进行分析,统计思路见图1。

可见,多水平回归是一种嵌套结构,上层回归系数受到下层的调节,使数据在不同层次间产生关联。在控制非教育因素的影响后,学生层系数的变化会影响教师层系数的估计。

基于以上分析,4种增值模型的构建思路和统计方法有相似之处,也存在明显的差异。为了更加直观地比较增值数据的特点,本文从复杂性、信息量、精准度、系统性和诊断价值5个维度总结比较增值数据特征,见表1。

首先,增值数据的分析。准确分析增值数据是一项前提性工作,分析的科学性决定了后期报告的效果,这个过程由分类、整合、解释和评估4个环节组成。分类是指依据模型类别或师生特点等,将总体的数据集合理地分为若干部分;整合是指在不同学校、学科或年级的数据集中提取具有类似特征的样本。分类与整合能够保障数据的结构性,为下一步的解释和评估奠定基础。解释是分析增值数据的关键,妥善解释不同模型的统计方法和增值含义有助于评价相关主体准确理解增值数据,如获得分数模型的计算结果在统计上不考虑其他因素,对其解释可较为客观、直接;对基于回归的增值模型而言,数据内容较为复杂,解释需要用易于理解的表达方式。评估是指对数据的科学性作出判断,包括规范的数据采集和统计,如评估数据的信度和效度是否达标等,以确保后续报告的质量。

3.1健全综合评价反馈

3.2加强形成性的反馈

参考文献

(本文首次发表在《中国考试》2023年第5期)