百科问答小站 logo
百科问答小站 font logo



分班教学能显著提高成绩吗? 第1页

  

user avatar    网友的相关建议: 
      

题主的问题真的非常赞,属于那种看似不太起眼但影响甚大的问题,回答起来不容易。自己恰好了解一点文献,下面的回答是用自己以前的笔记改写的,删掉了技术性内容,同时合并了一些非常类似的文献。前半部分是分析,后半部分是实证结果,如果只在意结果可以直接跳到最后。先在开头提一点,答主说的竞争效应是有,但分班教学对整体成绩的影响有可能是负面的。除了顶端的学生,其它大部分可能都是受损的,甚至有可能顶端的学生也不讨好。

和答主问题直接相关的这一块研究是评估区别教学(tracking,streaming,group studying)的整体效果,同伴效应(peer effect)也会做,但只是作为整体结论的一部分。题主问的就更加细了:同伴效应中相互竞争的成分有多大?从严格的实证研究角度讲,这个因果很难单独评估出来,因为把成绩相同的孩子放在一起,他们有可能相互竞争,也有可能因有类似的家庭背景和社会地位而更容易沟通,也有可能因为缺乏多样性而影响创造力。因此,限于学力,我只能列举一些更加宏大一些的研究。像答主说的这种问题,一般都要受控随机实验(RCT,Randomized Controlled Treatment)才能做出来,很多时候教育学家、经济学家常常没有这个条件。因此,这里列举的绝大部分研究和分析都是针对分流教学的,包含了分班/择校等各种区别能力教学的措施。

不同国家对于分班的定义不一样,研究的时候也有必要界定。在我个人理解,题主应该指的是我们国家高中和部分初中初中普遍存在的分实验班(火箭班、快班、强化班)以及普通班(平行班、慢班)教学的现象,这在西方国家也是普遍存在的。但是,我们现有的研究很多时候不会在这个层面上做,主要原因是因果关系分离不清楚。如果我们只是单纯比较快班和慢班教育的成果,包括升学率、高等教育完成比率、失业率、犯罪率以及青少年怀孕比率等,我们就会忽略其它变量对学生表现的影响。比如说,最简单的,有可能一个学生内在能力就是比另一个要强,所以他/她去了实验班,而另一个去了普通班,以后我们观察到的人生轨迹分歧可能都是拜内在能力所赐。另一个很有可能形成干扰的因素是家庭背景,包括家庭收入、父母教育、祖父母教育,等等。这一因素同样会同时影响学生进入快班的概率以及日后的成就。这些因素都会干扰我们希望进行的研究。

解决的方法主要有以下几种。一是做受控实验。尽管有一些争议,但这应该是教育学家、经济学家能够做到的极致了。可惜的是,非常严格的关于分流的实验目前很少,Duflo等学者2008年在肯尼亚做了一次。很多时候我们会退而求其次,选择一些大家预料不到的事件作为准实验,来观察分流的影响。比如说芬兰在上世纪进行了一次学制改革,将普遍义务教育的时间延长了两年。由于芬兰的教育制度是在义务教育后分流学生,所以这次改革相当于在全国范围进行的一次实验,个体是否接受改革不受自身特质和家庭背景影响,从而可以得到分流时间推迟对学生成绩的影响。另一种选取准实验的典型方法是观察入学制度的改革,像Kang在2006年的文章选取的就是韩国初中的学区内随机分配学位制度(在中国很多地方直接叫派位或者电脑抽签)。最后一种办法就是直接控制家庭变量了。这一类研究欧美比较多,因为他们微观数据比较好,在中国可能不太好做。

现在可以开始讨论分流问题了,在介绍实证结果之前,有必要先把理论梳理一遍。实际上,不管是学校里分快慢班,还是在学校层面上的分流,比如非常严格的新加坡分流教育,实质都是一样的:把不同水平的学生放到一起,提供不同的教学资源。这一观点在西方很早就有大量的争论,二战后很多国家都经历了去分流化(de-tracking)的浪潮。传统观点认为分流教育本身是公平vs教育的取舍:将不同的学生放在一起教育,可以确保他们大致得到相同质量的教育,遏制分化;将不同的学生分开教育,可以因材施教,提高教育系统的效率。这是传统观点,但失之粗糙,很有必要细化之,所谓的权衡取舍,可能根本是不存在的。

分流/不分流之间,学生会在哪些方面有所不同呢?首先是师资方面。如果是同一学校内部,师资分化大致不会特别严重,但配备的老师仍然有可能有差别,老师在各个班级的投入也未必会相同。如果学校对出成绩特别重视,分流出来的好班很有可能得到更多的资源。如果分流不是在学校内部进行,这一现象可能会严重得多,好的公立学校和差的公立学校师资力量可能有天壤之别,而顶尖的私校又凌驾于公立学校之上,可能在全球范围内享有盛誉。同时,不同能力的班级,或者招收不同等级学生的不同学校,学生的选择权也可能有很大差别。比如说交换机会、大学水平课程、艺术体育类训练等,可能因为不同的划分而有差距。当然,划分班级也有可能帮助老师更好地实施针对性的教学措施,比如美国的KIPP项目。老师不需要害怕压抑高水平学生,也不需要担心落下还未达到熟练程度的学生,可以制定一份单一然而非常深入的计划,用统一的方式实施沟通,这是支持分流举措的。因此,在教师方面,存在两个相反的因果关系。

接下来是学生层面的因素。这里最大的争议就是同伴效应究竟有多强。这又是一个文献浩如烟海的子领域,极难穷尽,这里做最简略的勾勒。最关键的问题是,我们想知道在规定集体规模的基础上,不同水平学生互动,对双方可能造成的影响。如果是班级内部成绩好的和成绩坏的频繁互动,那这就叫做结对子。如果是直接把学生划分成两个班,那就叫做分流。如果不分流,班级内部会有更频繁、更多样化的不同水平和不同个体特征的学生互动;如果分流,则互动限制在类似学生之中。这里也存在多种因果效应,向Kang在韩国中学的准实验研究显示:同伴效应极为明显,同伴的成绩是预测学生个人成绩的良好变量,且成绩好的学生更愿意和成绩好的学生玩耍。在英国、美国和肯尼亚进行的实验得到了类似的成果。但也有不同的结果,Rozelle和其他三名中国学者在大陆农民工子弟学校进行的随机试验显示:让好成绩和成绩不那么好的学生结对子平均而言不会影响好成绩学生,而他/她的伙伴成绩平均有接近20%个标准差的上升。如下图所示,左半边代表同伴效应对成绩的影响,右半边代表个人因素,可以看到结对儿确实提高了个人成绩。分不分流,除了影响学生之间竞争的欲望和强度之外,还会影响他们沟通的对象和方式,以及成长过程中接触到的多样性,此处也存在一些很难分离的因果效应。



分流/不分流的决定还会通过影响学校生源,进而影响教育市场的均衡。这一块有一些数学上十分艰难的研究成果,但想法是非常朴素的:如果市场上同时存在公立学校和私立学校,公立学校会自发地选择分班。因为,如果同伴效应显示周围都是好学生的成长环境有好处的话,家长就会设法为孩子创造这个环境。如果公立学校鱼龙混杂,家长担心自己的孩子会受到不良影响的话,就会把孩子送到私立学校。公立学校为了吸引高质量生源,必须实施分流教学。相反,在市场均衡中,私立学校实施分流的强度可能还要低于公立学校。另一股影响分流教育决策的力量来自劳动力市场,用工企业总是希望劳动者身上有一些清楚的标识,这能够帮助他们更好地识别毕业生的能力。如果学生选择进入一些更加职业化,但整体来看阅读、逻辑、数学等科目相对较弱(用成绩分布的一阶占优衡量)的教育轨道,他们会有一个清晰的标签,但也丧失了一些获取综合知识的能力。如果学生选择进入更加综合的教育轨道(比如通常的高等教育),他们会有更好的阅读、逻辑等知识,但也会面临更大的劳动力摩擦,因为此时他们身上并没有那么明显的标签。因此,每个国家都需要确定是否分流、分流的方式以及最佳的分流时间。Ken等四名学者在2006年指出:在大部分国家,分流可能是太早了。

由前面几点分析看到,想要直接通过捋顺几方面因果关系来得到题主问题的答案很难,因为可能的因果关系很多,很难分离出来。因此,我们最终还是要回到实验或者准实验的路子上来,直接做整体的研究,直接研究分流对成绩的影响。在介绍实证文献之前,可以先说说具体的实证策略,主要是双重查分(DID,Difference-in-difference)。主要技巧就是通过国际的或者省级/洲际数据,通过不同的州比较来消掉学校特征随时间变化的趋势,通过不同时间段的比较来消掉各地学校一些独有的特征,从而得到分流对成绩的正效应。也有少数研究用了倾向得分匹配(PSM,Propensity Score Matching)和RD(Regression Discontinuity Design)。不过相比之下,双重差分占了绝大多数。


首先要介绍的是Hanushek和Woessmann在2005年做的研究。他们的文章用的是DID(PS)M,结合了DID和PSM方法,具体是利用大量关于已有特征的数据构造出实验组和对照组,然后再做DID。研究涵盖了60多个国家。每个国家是否分流有已有的权威数据库衡量,学生成绩来自PISA,就是之前中国学生在其中表现相当出色的那个国际测试。他们研究的结论偏重于两方面:一是效率,在这里用国际测试中的成绩衡量;二是公平,用该国学生测试分布的标准差衡量。分布的标准差衡量了整体分布的离散程度,标准差越大,说明学生的成绩越分散,内部越不平等;标准差小,说明学生的成绩比较集中。这篇文章得到的结果还是比较震撼的,它说明所谓公平和效率的权衡取舍可能根本就不存在。首先,上图显示,更早的分流降低了整体成绩。我们可能通常以为,分流教学是损不足以奉有余,好学生在好的环境中可能变得更好,不那么好的学生则会变得更差。可事实并非如此,从上图可以看出,早分流的国家,几乎每个分段的学生在国际测试中成绩下降了。5分位点代表的是末尾的学生,95则是顶端的学生,他们的成绩都下降了,只是顶端下降的幅度要小一些而已。下图使用PIRLS(一项在全球小学中进行的统一测试)讨论了公平的问题:红线是初级中学不分流的国家,黑线代表初级中学分流的国家。很明显,大部分红线国家内部成绩分化程度在初中比小学有所下降,而黑线国家成绩标准差普遍上升。因此,这篇研究告诉我们:公平效率之间未必有权衡取舍,也有可能两者同时受到损害


Brunello和Checchi在2006年完成的另一项研究考察了分流教学的长期影响。他们没有使用当时的成绩做被解释变量,而着力于考察分流教学对学生个体未来更长期的“成绩”,包括最高学历、失业率以及劳动收入的影响。他们在回归中不仅包括了单纯的分流教学项,也纳入了学生家庭背景和分流教学的交互项,如果这一项估计出来系数是正的,说明分流教学会放大家庭背景对学生长远道路的影响。两位作者在这里用父母教育水平来衡量家庭背景,而数据检验也显示在样本数据(主要是欧洲国家)中,父母教育程度和家庭收入等变量有非常高的相关性。很可惜,结果非常显著,意味着更早的分流教学会放大家庭背景对学生未来的影响。父母教育背景更高的学生在学历、收入和工作稳定程度方面的优势会被早分流进一步放大,这是分流教学损害公平的另一项证据。我们还可以举出更多类似的例子,Checchi和Flabbi用意大利的数据得到了类似的结果,他们还发现,如果更早地实施学生分流,女生的未来受家庭背景影响比男生受家庭背景影响的幅度也更大。Pekkarinen等三名学者用1972-1973年芬兰推迟分流的教育改革做了估计,发现了两点效应。一是延迟分流时间显著提高了那些父母只接受过基础教育的学生分数。二如下图所示,控制其它因素之后,随着改革的进行,学生的测试分数稳步提升。



我再给出一些支持这方面观点的更多例子。Elg、Steek和Webbink利用荷兰各行政区学校数量的差异作为工具变量检验了这一话题。在荷兰,学生小学毕业以后可以走两路学制,一路是职业轨(Ibo),这边拿到的学位不能直升大学(Hbo/Wo);一路是高等教育轨(Havo/Vwo),可以直升大学。学生在12岁毕业之后需要做选择,除了这两个选项之外,他/她还可以选择推迟选择,先在混合轨(Mavo-Havo/Mavo-Havo-Vwo)待一到两年,然后再选择进入哪个轨道。由于荷兰各个地区中学教育资源并不均衡,进入混合轨的比例也会相应有差异。作者用这一点做工具变量探讨了分流时间对高等教育毕业率的影响,发现先在混合轨待一段时间的学生,在大学的毕业率要显著高于直升高等教育轨的学生。此外,还有Meghir和Palme利用瑞典学制改革进行的研究,Schnepf和Dustmann利用德国数据进行的研究,都说明分流愈早,家庭背景(包括父母教育以及职业)在学生未来发展(第一份工作工资水平、失业率、大学毕业率)影响愈显著。Bauer和Riphn在瑞士的研究也印证了这一观点。同样的研究也在英国、意大利以及美国进行并得到了类似的结论。Galinro-Rueda和Vignoles指出在英国,与家庭背景重要性上升相随的是教学资源配置的效率降低,教育的回报率也降低了。



这样的研究可能给人留下一个印象:分流教学似乎一无是处。这当然不是事实。我们也有一些其它的研究指出分流教育可以提升个人的成绩。比如前面提到的,Duflo等学者在肯尼亚做的随机对照试验,就显示分班教学可以显著提升学生的成绩。看上面这张图,蓝线很明显要比红线高出一截。不过,这只对那些签合同拿工资的老师有效,如果是那些有政府编制的老师,有铁饭碗,那这个差距就要小很多。Kirabo Jackson在特立尼达和多巴哥做了类似的实验,发现接受分流教育的学生数学和英语成绩更好,也更容易拿到毕业证书。在2000年以前,像Rees和Argys这些著名的教育学家都是都认为公平-效率取舍可能存在,但2000年以后大量运用新统计手段的研究挑战了这一结论。以最近的两篇论文为例,理论计量学者Bonhomme和Sauder用新的计量方法,以纽约的数据做了一项类似的研究,发现好学校和坏学校之间的成绩差异几乎完全可以由学生组成的差别解释,同伴效应并不显著。同样是用美国的数据,Zajonc估计了一个动态的分流模型,发现公平-效率取舍有可能存在,但是样式比我们想象的要更复杂。仔细观察下图,纵轴是标准差,代表公平,横轴是平均分,代表效率。每一条闭合曲线都代表一个可能性区域,内部包含了特定分流政策下能取到的公平-效率组合。这个曲线并不是直线或者其它什么简单的形状,意味着即使真有权衡取舍,关系可能也比我们想象的要复杂得多。


总而言之,尽管也存在一些正面证据,但一系列总体研究和个案研究都显示分流教学对学生测试分数的负面作用,这意味着有可能单纯的分班并不能提高成绩,我们观察的成绩差异主要来自家庭背景、学生组成和师资投入。此外,分流教育很有可能放大家庭背景差异对学生未来的影响,如果我们更在意中学阶段教育的公平性,这应该引起我们的注意。最后还要提一下Bol和Werfhorst的研究,他们发现全国统一的标准化考试可以减缓这一放大作用,我想这个结论对中国是有现实意义的。

参考文献:

Ammermueller A, Pischke J S. Peer effects in European primary schools: Evidence from the progress in international reading literacy study[J]. Journal of Labor Economics, 2009, 27(3): 315-348.

Argys L M, Rees D I, Brewer D J. Detracking America's Schools: Equity at zero cost?[J]. Journal of Policy Analysis and Management, 1996, 15(4): 623-645.

Bauer P, Riphahn R T. Timing of school tracking as a determinant of intergenerational transmission of education[J]. Economics Letters, 2006, 91(1): 90-97.

Betts J. The economics of tracking in education[J]. Handbook of the Economics of Education, 2011, 3(341-381): 4.

Bol T, Witschge J, Van de Werfhorst H G, et al. Curricular tracking and central examinations: Counterbalancing the impact of social background on student achievement in 36 countries[J]. Social Forces, 2014: sou003.

Bonhomme S, Sauder U. Recovering distributions in difference-in-differences models: A comparison of selective and comprehensive schooling[J]. Review of Economics and Statistics, 2011, 93(2): 479-494.

Brunello G, Checchi D. Does school tracking affect equality of opportunity? New international evidence[J]. Economic Policy, 2007, 22(52): 782-861.

Brunello G, Rocco L, Ariga K, et al. On the efficiency costs of de-tracking secondary schools in Europe[J]. Education Economics, 2012, 20(2): 117-138.

Checchi D, Flabbi L. Intergenerational mobility and schooling decisions in Germany and Italy: The impact of secondary school tracks[J]. Rivista di Politica Economica, 2013 (3): 7-57.

Clark D. Selective schools and academic achievement[J]. The BE Journal of Economic Analysis & Policy, 2010, 10(1).

Duflo E, Dupas P, Kremer M. Peer effects, teacher incentives, and the impact of tracking: Evidence from a randomized evaluation in Kenya[J]. American Economic Review, 2011, 101(5): 173974.

Dupriez V, Dumay X, Vause A. How do school systems manage pupils’ heterogeneity?[J]. Comparative Education Review, 2008, 52(2): 245-273.

Dustmann C. Parental background, secondary school track choice, and wages[J]. Oxford Economic Papers, 2004, 56(2): 209-230.

Epple D, Newlon E, Romano R. Ability tracking, school competition, and the distribution of educational benefits[J]. Journal of Public Economics, 2002, 83(1): 1-48.

Epple D, Romano R. Peer effects in education: A survey of the theory and evidence[J]. Handbook of Social Economics, 2011, 1(11): 1053-1163.

Figlio D N, Page M E. School choice and the distributional effects of ability tracking: does separation increase inequality?[J]. Journal of Urban Economics, 2002, 51(3): 497-514.

Galindo-Rueda F, Vignoles A. The Heterogeneous Effect of Selection in Secondary Schools: Understanding the Changing Role of Ability[J]. 2004.

Hanushek E A, Wößmann L. Does early tracking affect educational inequality and performance? Differences-in-differences evidence across countries[J]. Economic Journal, 2006, 116(510): C63-C76.

Kang C. Classroom peer effects and academic achievement: Quasi-randomization evidence from South Korea[J]. Journal of Urban Economics, 2007, 61(3): 458-495.

Kerr S P, Pekkarinen T, Uusitalo R. School tracking and development of cognitive skills[J]. Journal of Labor Economics, 2013, 31(3): 577-602.

Kirabo Jackson C. Do Students Benefit from Attending Better Schools? Evidence from Rule‐based Student Assignments in Trinidad and Tobago*[J]. The Economic Journal, 2010, 120(549): 1399-1429.

Li T, Han L, Zhang L, et al. Encouraging classroom peer interactions: Evidence from Chinese migrant schools[J]. Journal of Public Economics, 2014, 111: 29-45.

Meghir C, Palme M. Educational reform, ability, and family background[J]. American Economic Review, 2005: 414-424.

Mocetti S. Educational choices and the selection process: before and after compulsory schooling[J]. Education Economics, 2012, 20(2): 189-209.

Robertson D, Symons J. Do peer groups matter? Peer group versus schooling effects on academic attainment[J]. Economica, 2003, 70(277): 31-53.

Schnepf S V. A sorting hat that fails?: the transition from primary to secondary school in Germany[M]. Florenz: UNICEF Innocenti Research Centre, 2002.

Slavin R E. Synthesis of research on grouping in elementary and secondary schools[J]. Educational Leadership, 1988, 46(1): 67-77.

Van Elk R, Van Der Steeg M, Webbink D. Does the timing of tracking affect higher education completion?[J]. Economics of Education Review, 2011, 30(5): 1009-1021.

Zajonc T. Bayesian inference for dynamic treatment regimes: Mobility, equity, and efficiency in student tracking[J]. Journal of the American Statistical Association, 2012, 107(497): 80-92.




  

相关话题

  如何简单地说出中国中学教育的失败? 
  如何评价「学士后」现象? 
  平顶山一老师揪学生头发致皮骨分离,要承担哪些法律责任?体罚事件层出不穷的原因是什么? 
  像哈佛、麻省理工、斯坦福这类的学校的教育水平是否被过誉了? 
  出身能占成功多大因素? 
  27岁女生,单身,无学历无背景,现在感到很迷茫怎么办? 
  为什么只有“小清华”之争,没有“小北大”之争? 
  如何看待肖战超话里的教师天团? 
  如何看待北海道知事铃木直道要求道内中小学停课,并表示“所有结果,都将由我知事本人负责。”? 
  如何用经济学知识讨价还价? 

前一个讨论
苹果在 2020 年 9 月 15 日(当地时间)举办的 Apple 特别活动,有哪些值得关注的信息?
下一个讨论
何进为什么要召董卓进京?





© 2024-12-22 - tinynew.org. All Rights Reserved.
© 2024-12-22 - tinynew.org. 保留所有权利