此外,对学生中考总分的零模型中随机效应部分分析得知,其组内相关系数(ICC)为0.20。这表示,学生中考总分中有20%的成绩差异位于学校水平上,且这种差异具有统计学意义,表示多水平模型在此具有适用性。在增值模型中,学生层次残差变异降低幅度非常明显,根据朗登布施和布瑞克(Raudenbush&Bryk)所提供的公式[U],上述变量的纳人能解释学生层次上77.6%的成绩差异。 高于平均水平的学校,最高端小于0的是增值显著低于平均水平的学校,其余学校的增值与平均水平无显著差异。从图中可以直观地发现,超过一半的学校在统计上与平均水平无显著差异。ID为18的学校在三科增值中均显著高于平均水平,而ID为2的学校则在三科中均低于平均水平。 (三)增值的跨年度稳定性估计增值的跨年度稳定性需要对每个年份的学校总分增值进行单独估算。例如,要估计第二年的学校增值,就需要以测试2成绩为学习基础变量,以测试3成绩为学习结果变量。其他自变量的选择仍然与前述模型一致。模型的参数估计部分从略。从表4中可以看出,学校增值在各个年度之间相关性极低,有时甚至为负值。学校增值排名和类别在各年间完全无规律可循k值和K值不能显著区分于0)。这表明学校的增值在各个年度之间变异极大,缺乏稳定性。 本文主要分析了学校增值在各学科之间的一致性以及在各年之间的稳定性。研究发现,学校增值在不同学科间一致性程度较低;基于同一届学生计算的学校增值在不同年份中缺乏稳定性。 本文中学校增值跨学科一致性较低的发现与国外有关研究的结论是比较一致的。如托马斯等学者的研究就表明,英国中学的增值效能在不同科目间不大一致,各科增值的相关系数仅在0.20到0.58之间。[12]这表明部门效应(departmenteffects)在中国学校中同样存在。由于不同学科的学习对于学生的要求是不同的,即使这些学生都同处一所学校,他们取得的进步在各科目之间也不一定相同;同时,学校内部不同部门(教研组)的效能受到这个"亚组织"内部的领导、结构和氛围的影响,导致了同一学校不同科目间学生进步的差异。从政策涵义上来说,增值的跨学科不一致性表明了评价学校效能不能仅依赖于某一种标准,因为一种标准可能只强调了学校教育的某一个特定方面。同时,基于学生各科总分计算的增值可能会掩盖校内各个学科教师效能的差异。如果以学校整体的增值来实施教育问责或绩效评价,好的结果是信息反馈到学校后能让教师反思来改进各科教学;不好的结果是可能会引起部分学科教师的"搭便车"行为。因为一所学校的增值可能仅仅是由部分学科的教师所贡献的,其他学科的教师即使不努力,也不一定能从总分增值指标中反映出来。 |