形成性评估测试型工具对语文教学的反拨作用研究

摘要

形成性评估,以学习为导向,注重了解学生学习过程的进步情况,及时发现教学存在的问题,从而提供有效的反馈,并帮助教师确定下一步的教学计划。汉语作为第二语言教学领域对形成性评估的研究虽然不少,但一直以来汉语作为第二语言,其教学评估的体现形式是以终结性评估为主。与此同时,形成性评估虽然被证明有效促进教学效果,但是一直很少被推广,这说明形成性评估方法不是适用于所有的教学环境,或是存在一定的利弊,可能实施过程中遇到问题,或是时间不够,或是学生不太愿意配合等局限。

因此,本文旨在通过教学实践,探讨形成性评估测试型工具对教学的反拨作用,以柬埔寨客属会馆公立崇正学校专修语文课堂的19名学生为实践对象,进行了为期八周的班级个案跟踪研究,通过教学实践探索形成性评估实施的局限性并提出对应策略。

本文采用班级个案跟踪研究法,在形成性评估实施前后分别对学生进行两次“学习者个体差异量表”的数据收集,然后通过spss两配对t检验解释形成性评估测试型工具是否影响学习者的“个体差异”,研究表明:形成性评估对学习者个体差异的部分因素产生显著性影响,如考试焦虑、元认知策略、努力程度等。通过对学生和学校领导进行访谈,发现虽然他们支持形成性评估在该校实施,但是由于各种客观原因,如:教学时间紧张、教学模式固定化等,导致形成性评估暂时还不适合在该校全面实施。最后,本文结合访谈结果提出相应的策略。希望通过本文的研究和反思,为当地华文教育提供一点参考,为促进汉语作为第二语言教学形成性评估的应用起到一定的作用。

关键词:反拨作用;个体差异;语文课堂形成性评估;局限性

1绪论

1.1研究背景与问题

Black和Wiliam(1998)采用文献研究法,收集了681篇论文,共涉及心理测量、教育评估、心理学以及76种教育学。随后,他们筛选出250项课堂形成性评估研究,并以元分析法为基础,对相关领域展开深入探究,并得出了“形成性评估的确促进了学生的学习”的结论。

在中国,对形成性评估的研究主要集中在大学英语。汉语作为第二语言教学领域对其的研究虽然不少,但一直以来汉语作为第二语言教学主要还是以终结性评估作为教学评估的主要方法。笔者于2019年以《探究华文教育中形成性评估的应用——以金边公立崇正学校为例》为题进行实地调查,结果发现,当地华文教师对形成性评估是不了解的,虽然有部分教师表示自己常用小测验的方法,但他们并没有给学生提出有效的改善性反馈和作出教学上的调整,这并不符合形成性评估的要求。可见,形成性评估虽然被证明有效促进教学效果,但是一直很少被推广,这说明形成性评估方法不是适用于所有的教学环境,或是存在一定的利弊,可能实施过程中遇到问题,或是时间不够,或是学生不太愿意配合等局限。

另外,形成性评估至今还没有经过研究得到统一和具体的操作方法。形成性评估较为特殊,属于非正式评估法。在此基础上,作业、课堂观察、档案袋、学生互评以及自我评估均为形成性评估。这些方法随意性和主观性强,没有一定的标准,而且需要教师投入大量的时间和精力去收集、整理、处理数据等相关工作,这对教师来说也是一个挑战。。。

因此,为了进一步了解形成性评估实施过程的局限性,我们想借用实习教学机会,尝试通过教学实践,将形成性评估应用在柬埔寨公立崇正学校专修部的语文教学当中,探索当地汉语教学形成性评估对教和学产生的影响。为了更好的结合理论进行研究,我们决定在实践中仅采用形成性评估方法中的测试型工具,即“小测验”,并结合语言测试的“反拨作用”理论,探讨形成性评估测试型工具对教学的反拨作用,以期找出类似于传统的“考试为导向”在教育环境对实施“以学习为导向”的形成性评估的反拨作用、局限性以及对应策略。

本研究提出以下四个研究问题:

问题1:形成性评估测试型工具是否影响学习者的“个体差异”?

问题2:形成性评估测试型工具,对教学产生什么性质的反拨作用?

问题3:在实施形成性评估过程中遇到哪些局限?

问题4:学校领导和学生如何看待在该校实施形成性评估测试型工具?

希望通过本文的研究和反思,为当地华文教育提供一点参考,为促进汉语作为第二语言教学形成性评估的应用起到一定的作用。

1.2相关概念界定

1.2.1形成性评估

从实际情况来看,形成性评估涉及范围较广。简单来说,形成性评估能够帮助教师掌握学生的学习计划、学习进度以及知识掌握情况,并以此为基础,不断优化教学计划,逐步提升教学质量。(龚亚夫、罗少茜,2002)。

形成性评估的概念是指评估人员要掌握学生的基本情况,并在教学过程中,采用恰当的方式完成评估。需要注意的是,单元测试与非正式考试均为形成性评价的核心组成部分。在单元教学中,教学目标的重要性会对测试编制构成较大的影响。对教师来说,要想掌握学生的学习进度,必须采用形成性评估。通过这种方式,获得较高的反馈频率,并以此为基础,尽快调整教学方案,逐步提升课堂质量。莫雷,2007)

它不同于我们常用的期中、期末考试,即“终结性评估”。Cizek(2010)认为,形成性评估与终结性评估两者的区别在于评估的“时间”和“目的”。需要注意的是,评估人员以学年、学期以及单元等时间段为基础,对课堂主体进行评估,被称为终结性评估。评估人员在教学过程中,对课堂主体进行评估,被称为形成性评估。在此基础上,后者的评估效果更加准确,并且可以提高学生自我评估能力等。

罗少茜、黄剑等(2015)指出形成性评估的核心部分为判断力。属于课堂活动范式之一。简单来说,评估人员要提前设计好相关任务,并以任务结果为基础,对课堂主体的表现进行记录。需要注意的是,档案袋、纸笔测试、任务以及课堂提问均为收集信息的有效途径。不仅如此,评估人员还要对相关信息进行整理,进一步提高学生的语言水平。

综合上述的定义,我们可以理解“形成性评估”是指在教学过程中进行的评估或评价,并掌握学生的学习进度,从而及时提出反馈,并对教学计划作出调整,最终目的是为了促进教学效果。

本文所指的“测试型工具”是以课堂小测验的方式作为形成性评估工具。

1.2.2 反拨作用

在实践过程中,学习和教学都会受到测试的影响,此类测试的反拨作用,也就是所谓的“反驳效应”。Hughes(1989)在研究该领域时,认为大纲设计者、教材编写者、学员以及教师均为参与主体。

Mesisck在研究过程中,强调可以影响师生完成本不必完成的任务,就是所谓的反拨作用。需要注意的是,反拨作用存在强弱之分。因此,研究人员要对反拨作用进行检测。

综合上述对反拨作用的定义,我们可以理解“反拨作用”是实施测试后,对教学产生的正面或负面的影响。

1.2.3 语文课程

由中华人民共和国教育部制定的《语文课程标准》(2011年版)中,明确表示:“语文课程是一门学习语言文字运用的综合性、实践性课程。义务教育阶段的语文课程,应使学生初步学会运用祖国语言文字进行交流沟通,吸收古今中外优秀文化,提高思想文化修养,促进自身精神成长。工具性与人文性的统一,是语文课程的基本特点。”

从实际情况来看,《语文课程标准》明确表示,培养学员对华文课程的兴趣,是语文课程的主要目标。与此同时,也要对学员的思维、语感以及词汇量进行培养。除此之外,教师要对学员进行引导,使其掌握自主学习的技巧。通过这种方式,解决口语交际、书面写作、文字阅读以及书写等方面的能力。不仅如此,语文课程还要充分发挥民族文化的趣味性,使学员感受到文化魅力,并主动探索相关知识。通过这种方式,提升课堂质量的同时,也可以提高学生的学习效率,

柬埔寨的华文学校将汉语作为教学媒介语,这里的专修部(相当于国内高中年级)有一门课叫做“语文”。而且公立崇正学校专修部语文课程所用的教材也是中国人民教育出版社出版的《语文》。这里的语文课程性质可以说是偏向母语教学的,但是学生的语言背景并非汉语普通话。除了当地华裔学生之外,还有部分非华裔学生也学习华文,因此,从教学对象来说,它不是母语教学或第一语言教学。但从课程性质上看,这里的语文教学基本上遵循《语文课程标准》进行授课。所以可以说柬埔寨华文教育中的语文课程是介于母语和二语之间的教学性质。

另外,贾益民(2007)在《海外华文教学中的若干问题》中将华文教学性质分为三类,其中的第四类写道:“华文教学作为海外双语或多语种之一的华文教学,指的是华语既不是第一语言、亦非第二语言的华文教学,或者说是介于第一语言和第二语言之间,处于双语或多语种语言教学环境中的华文教学。”

根据上文所概括的华文教学性质类别以及本文对华文教育的研究范围,贾益民(2007)所概括的几类情况比较贴合实际。究其原因,柬埔寨的青年受环境影响,更倾向于方言交流。与此同时,他们基本能听懂汉语方言,却习惯用当地语言回答。虽然他们有华人和汉语方言背景,但是他们在进入华校之前不会听说汉语普通话。因此在这种情况下,柬埔寨华文学校是属于第一和第二语言之间的华文教学性质,换句话说,柬埔寨华文教学虽然是将汉语作为第二语言教学,但同时偏向(中国)母语汉语教学。

华文学习者具有华语文化的背景,所以柬埔寨的华文教学不纯粹是语言教学,也不能跟对外汉语教学相同比,为了满足华文学习者的华裔背景需求,在语言教学的基础之上还要赋予学生于中华文化的相关内容。

由郭熙主编的《华文教学概论》中提出:“在海外华文教学中,除了要教会学生掌握汉语的基本知识、基本技能外,还要在此的基础之上,保持并发扬中华文化情结,培养并丰富学生的中华文化人格;帮助他们把所传承的中华文化融入所在国的主流文化中,和当地民族一起创造新的生活。”简单来说,提高学生的知识水平,是华文教学的主要目的。

因此,综上所述,本文对“语文课程”的定义是:柬埔寨华文学校中一门介于母语和二语学习之间的语文课程。除了工具性与人文性的统一之外,教师还要对学员的文化人格进行培养。通过这种方式,使两种文化融合在一起,逐步提高学员的文化知识水平,

1.3理论依据

1.3.1 反拨假设理论

Wall与Alderson(1993)在研究过程中,选取教师与学生为切入点,对测试反拨作用展开深入探究,并提出了一下假设:

表 1-1反拨假设理论

教师的“教” 学生的“学”
测试会影响教学 测试会影响学习
测试会影响教师的教学内容 测试会影响学生的学习内容
测试会影响教师的教学方法 测试会影响学生的学习方法
测试会影响教学的速度和顺序 测试会影响学习的速度和顺序
测试会影响教学的程度和深度 测试会影响学习的程度和深度
测试会影响教学的态度 测试会影响学习的态度

Alderson和Wall(1993)分析了反拨作用影响的范围,同时分析了反拨作用与教和学之间的关系。经过反复研究,他们强调测试的重要性与反拨密切相关。测试适用于全体师生,也只适用于该群体。

1.3.2 “PPP”反拨效应模型

对于测试反拨作用的相关研究,Hughes(1989)在研究该领域时,认为大纲设计者、教材编写者、学员以及教师均为参与主体。Bailey(1996)在研究过程中,明确指出应试策略、学习策略、教学内容、教学方法、大纲设计以及教材研发等领域的完善,都属于参与者的“参与过程”。此外,“参与者”包括教师、教材编写者、教学管理者以及学员。

图中可以看到,“测试”同时会影响学生的“学”、影响教师的“教”、教材编写的内容和大纲,以及研究者的结果,而最终的研究结果对教学的建议也会影响教师的“教”,而教师的“教”也将影响测试的方式。整个测试的反拨都会互相影响作用。

1.4研究方法

1.4.1调查量表法

本文基于FACAS焦虑量表、学习动机量表等进行改编,设计出针对公立崇正学校专修部语文学习的个体差异量表。在形成性评估实施的前期和后期分别进行两次调查。最终运用SPSS23.0软件对量表结果进行两配对t检验。

1.4.3访谈法

经过为期8周的教学实践之后,我们对被试学生和学校领导进行一次访谈,目的是进一步了解学校领导和学生是如何看待在该校实施形成性评估测试型工具。

1.3.2班级个案跟踪研究法

本研究采用班级个案跟踪研究法,以外语形成性评估流程为基础,设计出针对语文课堂的形成性评估流程,同时以《语文教材完全解读》的课标三维目标为依据,设计相关测试工具。在实施形成性评估测试型工具后,通过spss两配对t检验解释形成性评估测试型工具是否影响学习者的“个体差异”,并得出相关结论。

2文献综述

随着西方国家对教育思想的变革,教育评价和测量学相关研究的重心也从以个体差异、选拔英才为目的的教育转向关心和帮助每个学生的全面发展。克龙巴赫(1963)在研究相关领域时,撰写了《通过评估改进教程》。在文中,他强调评估既是提供信息的过程,也是决策的基础。另外,他认为教师要将教育评估融入教学过程。究其原因,教育评估具备时效性,间隔时间越短,起效越快。

1966年,斯塔夫宾(Stufflebeam)在克龙巴赫的《通过评估改进教程》的基础之上提出了CIPP模式。CIPP模式能够提供较为全面的信息,使评估结果更为准确。该模式中的“过程评估”主要是找出教育过程中所存在的问题,并提出改进的建议,可谓“形成性评估”的雏形。

斯克里芬(1967)在研究过程中,撰写了《评估方法论》。在书中,他详细介绍了总结性评估与形成性评估。如此一来,“形成性评估”应运而生。

布卢姆(Bloom,1968)在研究相关领域时,以斯克里芬的研究文献为基础,提升了研究结果的精度。他把总结性评估界定为在学习或教学结束之后对学生、教学效果、课程内容以及教师等方面进行评估。需要注意的是,评估过程对学习效率以及教学质量极为重要。

Black和Wiliam(1998)采用文献研究法,收集了681篇论文,共涉及心理测量、教育评估、心理学以及76种教育学。随后,他们筛选出250项课堂形成性评估研究,并以元分析法为基础,对相关领域展开深入探究。该理论的推广,使学界大感兴趣,并纷纷加入相关领域的研究行列。

在中国国内,对于形成性评估理论研究和实践起步较晚。2004年,教育部结合大学英语的教学情况,颁布了《大学英语课程教学要求》。通过这种方式,进一步优化大学英语教学质量,并提倡大学英语课堂教学应用形成性评估,越来越多人关注到形成性评估应用研究与实践,为国内形成性评估给予快速的发展。

在研究过程中,笔者选取知网为数据库,并以关键词查询的形式,对“形成性评估”进行检索。根据数据统计显示,知网共有575篇博硕论文,5304篇期刊以及6093篇相关文献。在所有文献中,外国语言文字学科文献数量达3191篇,数量最多,主要集中在大学英语教学,研究主要涉及形成性评估理论、体系构建、有效实证、对学生自主学习的提高等多个维度,如:刘振清(2008)、李清华(2010)、李清华和曾用强(2008)、王华(2010)、李清华和王伟强等(2014)吕剑涛(2018)、李春玲和刘振清(2010)、毕鹏晖(2017)、吕剑涛和杨满珍(2019)等。

形成性评估反拨作用的相关研究较少,主要集中在英语教学领域。目前在中国知网数据库中能搜索到形成性评估反拨作用的研究只有26篇文章,其中硕士论文5篇,均为英语教学领域内。研究主要涉对自主学习能力、口语教学、写作教学,以及形成性评估理论等维度的反拨作用。

黄影妮(2009)在研究该领域时,选取形成性评估与自主学习的关联性为研究对象,详细分析了两者之间的关系,找出问题所在后,并提供了行之有效的解决方案。

杨柳(2013)在研究过程中,选取自主学习为切入点,对其要求与特点展开深入探究。经过反复论证,最终得出结论:形成性评估能够提升学员的积极性,进而提高学习效率。在其影响下,学员的合作能力与学习能力都会随之提升。

孙芹(2013)通过课堂教学实践,收集的课堂观察,访谈,调查问卷及测试数据分别进行定性和定量分析。数据分析结果显示形成性评价在高中英语课堂的有效利用能对学生的自主学习能力产生积极的反拨作用。

郭晓楠(2012)通过实践教学,给学生分别发放一份前测和后测写作试卷,并对学生在实验前和实验后分别做了一次调查问卷,通过对比分析来得出结论。研究结果显示形成性评估对写作教学既有积极反拨效应,也有消极的反拨效应。

刘江娜(2014)通过实证研究,研究形成性评估对写作学习动机和学习策略的反拨效应。研究证明形成性评估能够增强学生英语写作动机,促进学生对写作策略的使用。

综合上述研究,我们发现,形成性评估反拨作用的研究主要集中在学习者的“个体差异”,而且仅研究其中的某个变量,如:“自主学习”“合作学习”“学习动机”“学习策略”等。“个体差异”对学习者的学习成就有着直接和间接影响,而“个体差异”中的变量之间也是互相影响的。崔刚(2016)以动态系统理论为依据进行研究并建立了完整的中国英语学习者个体差异的动态模型(图)。

形成性评估测试型工具对语文教学的反拨作用研究

图 2-1中国英语学习者个体差异的动态模型

该模型直观的解释了“个体差异”中每个变量的变化规律、影响变量之间的因素和互动关系等。

因此,我们认为,只对个体差异中的某个变量的变化进行解释是不足的,还需要综合其他变量进行研究,才能得到较全面的反拨作用相关信息。

3形成性评估测试型工具在语文课堂中的实践

3.1背景介绍

3.1.1学校办学模式及特点

学校的办学性质跟中国的国民义务教育非常相似,设有幼教、小学、初中、专修(二年制,相当于国内高中年级)共四个学段部门。需要注意的是,柬埔寨人民在学习汉语时,往往具备以下特征:

第一,柬华理事总会总领各华校的发展。

柬埔寨各公立华文学校都在柬华理事总会属下管理和领导。多年来,各公立华文学校都已形成一套完整的教学管理制度,包括统一学制、教材、教法、考试和评估模式等。

第二,华文学校实行半日制教学。

20世纪90年代,柬埔寨内战刚结束,由于经济落后,柬埔寨国民教育采取半日制教学,课室可供上、下午两个班使用。在这种情况下,柬埔寨的“汉语”教育极具特色。

第三,华文学校的教学媒介语是汉语。

从实际情况来看,学校里的教学媒介是“汉语”。在此基础上,学生必须努力学习“汉语”,也就给学生创造了良好的汉语言学习环境,所以柬埔寨华文学校学生的普通话水平也普遍不错。

3.1.2课程设置

在实践过程中,美术、音乐、拼音、英文、电脑以及地理均为副科:会计、柬文、历史、几何、代数以及华文均为主科。小学和初中使用暨南大学华文学院编著的本土化的《华文》教材;专修部使用人民教育出版社出版的中国普通高中课程标准实验教科书《语文》教材;其它课程有些是使用中国义务教科书,有些是学校自编的教材。

公立崇正学校实行半日制教学,每周上六天课(周一至周六),每天上4节课,周六只上3节课,其中一节课有40分钟的时间。专修部的语文课一周共设有6次课,一般要求6-8次课完成一篇课文的教学。

由于这里是半日制教学,再加上学生接受能力普遍较差和学生知识水平参差不齐,所以学校根据实际情况选择性的教授部分内容,对于语文基础知识的内容也没有很特殊的教学要求。

3.1.3专修部语文教学

专修班是柬埔寨华文学校的特殊办学模式之一,由于专修部学生的汉语水平已经达到一定的程度,崇正学校专修部选用人民出版社出版的中国普通高中课程标准实验教科书《语文》作为语文课程的教材。对于教学模式和方法与中小学部相对比也有所不同,学生不必再抄写生字、词,课文笔记由教师给学生划重点,学生要自己整理和完成其中的习题。

公立崇正学校教务主任高文胜老师表示:“虽然我们使用的教材是中国义务教科书,但对于海外学生而言,这本教材的难度非常高。我们在海外教授语文课程的教学目标主要包括:语言技能、中国文化知识、文学常识等。在讲析课文时可适当降低难度,应重视常用词语的教学、汉语写作能力、课文精彩段落的背诵、中国文化相关知识以及德育教育。”

3.1.4考试和评价模式

现今,柬埔寨华文教育的评估和考试模式还是处于传统性并且已经形成了全国华文教育固定的考试体系,崇正学校也不例外。按照规定:每学期分上下两段,段与段之间是分开的,就像国内的期与期之间一样。主科学段的测试次数为2,测试成绩占总评分的五分之二,剩余的五分之三均由期末考试与段考成绩决定。在综合评定中,不及格的科目超过一次,便失去升级机会。考试内容极少有主观分析题,很多学生只须死记硬背即可。这样的考试模式就是所谓的终结性评价,重视终结性考试,忽略了学生学习过程的收获情况。

3.1.5执行期及内容

本评估执行时间为2020年11月2日起至12月26日止。

从实际情况来看,该项目的研究周期为56天。人民教育出版社出版的普通高中课程标准实验教科书《语文》必修4(2006年,第二版)是选定的教材,教学实验期间的教学内容为该学期的第二学段,第六课《辛弃疾词两首》、第八课《拿来主义》、第九课《父母与孩子之间的爱》、第12课《苏武传》以及第11课《廉颇蔺相如列传》。该课程为主修课程,40分钟/节课,每天一课时,每周授课6课时,平均每周完成一篇课文的讲授。

3.1.6评估对象

该研究以公立崇正学校专修部二年级下学年班级(简称:专二下班)的19名学生为研究对象。专二下班,相当于中国国内高中二年级,该班同时也是毕业班,是全校年级最高的班级,他们同时也需要准备参加毕业考试。

3.1.7评估背景分析

了解柬埔寨公立崇正学校汉语学习背景基本情况后,笔者选取“SWOT”分析法为研究工具,详细分析了该领域的评估背景。需要注意的是,态势分析法是SWOT的全称。

在SWOT分析法的影响下,研究人员能从威胁、机会、劣势以及优势等方面入手,提高研究结果的准确性。柬埔寨公立崇正学校的SWOT分析如下:

表3- 1柬埔寨公立崇正学校SWOT分析表

S(Strength优势) W(Weakness劣势)
  1. 学校以汉语为教学媒介语,语文、数学、历史、地理、英文、柬文课等,教师均使用汉语进行教学。与其他学校相比该校的优势在于全汉语教学,对学生来说,也是很好的语言环境。
  2. 与国际学校相比,华校的中文课时安排量较多,平均每天安排一次课,一周安排6~7节语文课,每节课40分钟,略有优势,而国际三语学校则将英语课作为主要科目,汉语作为副科,平均每周仅安排3~4课时。
  3. 教学管理严格。该校对学生课堂学习纪律要求非常严格,注重道德品质教育,该校学生在纪律礼貌等方面都比较好。
  1. 目前该校的教师主要靠白板和一只板笔上课。课室没有多媒体教学设备,教师只能使用传统的教学方法,上课气氛也较枯燥。
  2. 课堂中以教师讲解为主,师生互动较少,学生上课方式较被动,缺乏发言积极性。
  3. 由于受到传统教学模式的影响,平常的教学都是填鸭式教学,学生也来不及消化所学内容,导致很多学生每次考试都是死记硬背,虽然能考试及格,但是他们并不理解所学内容。
  4. 缺乏优质的师资团队,学校师资本来较缺乏,于是对教师的招聘门槛较低,只要会中文都会考虑聘用。
  5. 学校缺乏经费来源。学校的经费收入主要靠学生缴纳的学费,仅凭学费来支撑整个学校的所有消费,教师的薪资也是没有保障。
O(Opportunity机会) T(Threat威胁)
专修班的特殊培养模式为学生提供了较多的就业机会。除了语文科目外,还设有会计、中柬翻译、中英翻译等技能性较强的课程。学业结束后,以学校推荐为主要方式,无缝对接中国企业的招聘和学生的就业。
  1. 平时考试、期中和期末考试都会给学生发考试范围,学生只要背考试范围里面的内容即可,形成了“为考而教”,这样导致学生对平时学习不够重视。
  2. 由于柬埔寨国际学校越来越多,再加上互联网发达,线上授课平台也越来越普遍,而崇正学校的教学管理模式和教学方式都还处在比较传统和陈旧,这对崇正学校的发展有很大的威胁。

3.2形成性评估的操作框架和流程

3.2.1形成性评估的操作框架

形成性评估是在教学时间段(章节、单元、学期)中进行,其目的是不断地改进教学、促进学习效果,所以形成性评估也应该是一个持续和循环的过程。评估结果是对学生学习进步的评价,可以采用正式任务,如测试等,也可以采用非正式的方法,如课堂观察、提问、学生自我评估、同班评估等,本研究为了更好结合测试反拨理论,仅采用测试工具。评估结果的具体信息也应该及时向学生反馈,再进入下一步的学习任务。学生根据反馈信息对自己的学习方法、策略等进行调整;教师则根据评估结果对下一阶段的教学计划、内容、方法等进行调整。

McMillan(2007)在研究相关领域时,对形成性评估的内容进行了确认。(图3-1)。

形成性评估测试型工具对语文教学的反拨作用研究

图 3-1形成性评估的循环框架

3.2.2对本课程的形成性评估流程设计

王华和甄凤超(2008)在研究相关领域时,选取CIPP模型为基础,完成了大学英语形成性评估流程的设计;需要注意的是,评估结果、评估过程、评估输入以及评估背景是CIPP模型的核心组成部分。以背景评估为例,该环节具有前置性。此外,明确教学需求与问题成因是背景评估的主要目的;对教学方案、教学计划以及教学质量进行判断分析,是输入评估的主要作用;对教学方案存在的问题、教学方案的优点以及教学方案的不足之处进行分析,并提供行之有效的解决方案,就是所谓的过程评估。

后来,王华(2010)对此模式加以简单化。通过元模型构建方法,分析和综合各种理论模式建立了外语形成性评估流程(图3-2),该流程目前在语言教学形成性评估体系中较为完整、系统和科学。

外语教学和华文教学的性质都是属于第二语言教学,兼备评估目标的共同点,因此我们决定将此评估体系作为语文课堂形成性评估流程设计的基础框架。

形成性评估测试型工具对语文教学的反拨作用研究

图 3-2外语形成性评估流程

基于王华(2010)的“外语形成性评估流程”的基础上,针对公立崇正学校专修部语文课程教学性质,结合华文教学、语文课程性质,我们对它加以归纳和总结,设计一个语文课堂形成性评估流程(图3-3),以测试型工具为例。

形成性评估测试型工具对语文教学的反拨作用研究

图 3-3语文课堂形成性评估流程

该评估流程图包括三个评估阶段:准备阶段、实施阶段和总结阶段。

第一阶段,准备过程。第一步主要是评估目的的设计,要确定好评估的主要目的,该流程也列出几个例子供参考,如提高学生学习积极性等。在确定好评估目的后,开始撰写教学方案,教案的撰写是教学必不可少的一个重要环节,好的教案能呈现出好的教学,所以教案也可以结合形成性评估目的、时间安排等进行撰写。第三步,根据教学目标制定评估工具,本研究以测试型工具为例,参考语《语文教材完全解读》制定评估工具,为了节约时间,建议制定如判断题和选择题等较简单的题型。

第二阶段,完成相关准备工作后,可实施正式的教学和评估过程。第四步,收集学生课堂表现相关信息。第五步,鼓励和动员同学们参与评估,给学生介绍评估目的、方法和内容以及评估的作用等。第七步,获得所需信息,包括背景、输入和过程的评估信息,第八步结合上述评估进行分析和判断。第九步,得出评估结论,并及时向学生提供反馈。

最后,是总结阶段。教师总结并撰写评估报告,最终判断教学计划是否继续以及如何调整教学。

以上三个阶段的流程,以课文为单位进行循环操作。

3.3形成性评估测试型工具的操作过程

3.3.1准备阶段

一、确定评估目的

根据公立崇正学校学生学习情况,观察到学生自主学习能力较差,受填鸭式教育影响,少发言等确定以下为本次评估目的:

提高学生学习积极性培养自主学习习惯让学生了解自己的优劣点提高学生学习成绩。

二、明确教学目标

本教学目标参考《语文教材完全解读》必修4课标三维目标,并以此作为测试工具制定的依据。教学目标如表3-2所示:

表3- 2语文必修4课标三维目标列表

课题名称 教学目标
第六课《辛弃疾词两首》
  1. 了解辛弃疾的生平和词作。
  2. 理解诗歌用典的表现手法。
  3. 理解诗词借景抒情的特点。
第八课《拿来主义》
  1. 了解鲁迅及其杂文特点。
  2. 学习本文幽默犀利的语言风格。
  3. 理清作品的论证思路,体会其比喻论证、正反对比论证的方法。
第九课《父母与孩子之间的爱》
  1. 熟悉作者背景,体会写作意图。
  2. 理清文章的写作思路,掌握结构特征。
  3. 学习本文对比手法的应用。
第十一课《廉颇蔺相如列传》
  1. 了解司马迁的生平及《史记》
  2. 掌握课文中的一些文言多义词和词类活用现象。
  3. 学习本文选择典型事件,在矛盾冲突中刻画人物的方法。
第十二课《苏武传》
  1. 了解班固及《汉书》,掌握文中涉及的重要实词、虚词,整理文中词类活用、一词多义现象。
  2. 体会文中环境描写,细节描绘的作用。
  3. 学习本文通过对比、映衬手法刻画人物的方法。

三、制定评估工具

(一)测试工具

评估工具为测试型工具,根据教学目标制定评估工具。测试内容由选择题和判断题两个题型组成。每次测试设5道题,每题20分,满分100分。测试通过谷歌表单进行线上测试。测试时间为10分钟。

课堂表现评价表及评价标准课堂表现评价表(见附件B),分别记录学生的课堂出勤情况(30分)、课堂主动发言(30分)以及作业完成情况的评分(40分),满分100分,平均分占40%。以一篇课文的完整讲授为单位,课堂出勤及课堂主动发言由学习委员记录并评分,作业评价由教师提供分数,学习委员收录。

课堂表现评分标准为:

课堂出勤:全勤记30分,迟到一次扣2.5分,缺勤一次扣5分,缺勤次数≥5,记0分。B. 课堂主动发言:每主动发言一次得5分,主动发言次数≥6,记30分。

C. 作业评价:准时提交课程笔记,认真完成,作业字迹整洁,课文背诵流利等,满分40分。

3.3.2实施阶段

一、实施计划安排

按照一般的课文阅读流程,教师要采用检查理解、课堂阅读、语言难点处理以及课文阅读情况等阶段展开教学。我们对测试工具的制定和实施也分为这三个阶段进行:

(一)课文阅读提示

在实践过程中,作者资料、文化内涵、时代背景、写作问题以及材料内容等方面均为阅读提示的关键节点。用时一课时,完成课文阅读提示后,进行一次测试,检查学生是否掌握以上内容的介绍。

(二)语言点处理

从实际情况来看,古今异义、诗词倒装句、语法难点以及生词介绍等方面均为语言点处理的内容。用时1~2课时,完成语言点处理后,进行一次测试,检查学生是否掌握以上讲解内容。

(三)组织课堂阅读

组织课堂阅读是学生在教师指导下完成阅读。在语文课堂,我们对课文进行梳理、讲解、讨论等。用时3~4课时,完成课文阅读后,进行一次阅读理解的测试。下表为形成性评估实施安排表:

表3- 3形成性评估实施安排表

时间 评估内容 数据搜集 评估产品
2020-11-3 第六课《辛弃疾词两首》 课文提示 测试1 课堂表现评价 测试成绩、课堂表现评价表
2020-11-5 语言点处理 测试2
2020-11-9 阅读理解 测试3
2020-11-10 得出评估结论,向学生反馈,决定教学计划是否继续或调整
2020-11-12 第八课《拿来主义》 课文提示 测试1 课堂表现评价 测试成绩、课堂表现评价表
2020-11-14 语言点处理 测试2
2020-11-19 阅读理解 测试3
2020-11-20 得出评估结论,向学生反馈,决定教学计划是否继续或调整
2020-11-23 第九课《父母与孩子之间的爱》 课文提示 测试1 课堂表现评价 测试成绩、课堂表现评价表
2020-11-24 语言点处理 测试2
2020-11-27 阅读理解 测试3
2020-11-28 得出评估结论,向学生反馈,决定教学计划是否继续或调整
2020-12-1 第十一课《廉颇蔺相如列传》 课文提示 测试1 课堂表现评价 测试成绩、课堂表现评价表
2020-12-3 语言点处理 测试2
2020-12-12 阅读理解 测试3
2020-12-14 得出评估结论,向学生反馈,决定教学计划是否继续或调整
2020-12-17 第十二课《苏武传》 课文提示 测试1 课堂表现评价 测试成绩、课堂表现评价表
2020-12-21 语言点处理 测试2
2020-12-25 阅读理解 测试3
2020-12-26 得出评估结论,向学生反馈,决定教学计划是否继续或调整

二、鼓励、动员评估参与者

给学生介绍评估目标、方法和内容,以及评估的作用,鼓励学生积极参与评估。

三、数据分析、反馈及教学调整

本次形成性评估测试型工具对语文课程下学段的五篇课文进行实施与测试数据收集,每篇课文按照阅读教学程序分别进行课文提示、语言点处理和课文阅读理解三个阶段的测试,每篇课文测三次,整个实施过程共测15次。我们将收集到的数据进行分析和作出相关判断。为了更科学地将考试成绩和课堂评价分数结合起来分析,我们设置课堂表现评分占比例40%,三次测试占比例60%,将两个项目的评估分数相加,最后得分为每位学生在本课评估的总平均分数。为了更直观,我们再对总平均分数按等级分为:A(90-100)、A-(85-89)、B+(82-84)、B(78-81)、 B-(75-77)、C+(71-74)、C(66-70)、C-(62-65)、 D(60-61)、F(不及格)。

下面是我们在实施形成性评估过程所收集到的测试和课堂表现评价的数据:

第六课《辛弃疾词两首》表3-4- 1第六课《辛弃疾词两首》形成性评估数据

课标:第六课《辛弃疾词两首》
学生 课堂表现 测试分数 总平均分 等级
课堂出勤

(30%)

主动发言(30%)作业评价(40%)总分占比例40%测试1测试2测试3总分占比例60%
S130535702810080802605280B+
S23003565269080802505076B-
S3300326224.88080602204468.8C
S427.503057.5236060501703457F
S5305356526100100802805682B+
S6300326224.88060602004064.8C-
S73010307028100100802805684B+
S8300356526100100802805682B+
S92002040166040401402844F
S103003060248060802204468C
S1125103570288080602204472C+
S1225035602410080802605276B-
S1330253590361001001003006096A
S1430203585341001001003006094A
S1530535702810080802605280B
S1630035652610080602404874C+
S172503055228080602204466C
S183003060246040401402852F
S193010357530100100802805080B

图3-4- 1第六课《辛弃疾词两首》形成性评估成绩统计

形成性评估测试型工具对语文教学的反拨作用研究

根据数据统计,本次评估成绩中,B+占比率最多高达21%,其次是A和C各占16%。其中有一位同学得C-成绩,三位同学得F成绩(不及格)。得C-和F成绩的四位同学,他们的共同点是课堂成绩较差,有数次缺课记录,课堂上不主动发言,另外三次考试成绩也较差,根据上面数据显示,同学们的测试2和测试3得分都普遍较低。

反馈及调整:根据本次评估数据,我们发现同学们的课堂表现的评价分数偏低,同学们应减少旷课迟到,应积极主动发言。同时发现同学们的语言点和课文理解部分没有掌握好,老师下次课也将重点讲授语言点和课文阅读理解相关内容。

第八课《拿来主义》表3-4- 2第八课《拿来主义》形成性评估数据

课标:第八课《拿来主义》
学生 课堂表现 测试分数 总平均分 等级
课堂出勤

(30%)

主动发言(30%)作业评价(40%)总分占比例40%测试1测试2测试3总分占比例60%
S130104080321001001003006092A
S23003565268080602204470C
S330035652610060802404874C+
S43003060244060801803660D
S5305407530801001002805686A-
S63003565268080802404874C+
S73010387831.21001001003006091.2A
S830540753010080802605282B+
S92553060244060401603256F
S1030040702880801002605280B
S1127.5103269.527.9280801002605279.92B
S12300386827.28080602204471.2C+
S133010387831.2100100802805687.2A-
S143010387831.2100801002805687.2A-
S153054075308080802404878B
S16250406526100801002805682B+
S172503560248060802204468C
S183003060246080602004064C-
S193010387831.280801002605283.2B+

图3-4- 2第八课《拿来主义》形成性评估成绩统计

形成性评估测试型工具对语文教学的反拨作用研究

根据数据统计,本次评估成绩中,得A、B、C等成绩的学生比较均衡,占比率都在10%到16%内。本次成绩与上一次的成绩相较明显进步,F(不及格)成绩的学生仅有一位,与上次成绩相比少了2位。

上一篇课文得F成绩的三位同学,在这次成绩中有一点进步,其中S18学生在上成绩升为C-;S4学生升为D;S9学生仍然得F成绩,但总平均分数比上次略高一点。这三位同学的进步,主要原因是他们三次测试的成绩比上一次高一些。

反馈:从整体成绩看,得A成绩的人数还是非常少,根据数据显示,所有同学的主动发言次数非常低,大部分同学基本上没有主动发言过。希望同学们多主动发言,改善课堂学习气氛。

决定调整:为了加强改善课堂发言的积极性,下一篇课文《父母与孩子之间的爱》由同学们分组做课文阅读报告。要求同学们对整篇文章进行分析,分别介绍文体、作者、写作背景、语言点讲解、画出课文结构图、读后感等,要求每位同学都必须发言并负责一项任务。学生报告完毕,老师作补充。

第九课《父母与孩子之间的爱》表3-4- 3第九课《孩子与父母之间的爱》形成性评估数据

课标:第九课《父母与孩子之间的爱》
学生 课堂表现 测试分数 总平均分 等级
课堂出勤

(30%)

主动发言(30%)作业评价(40%)总分占比例40%测试1测试2测试3总分占比例60%
S13010408032801001002805688A-
S230535702880100802605280B
S33053065266080802204470C
S43053065266080802204470C
S530104080321001001003006092A
S63053570288080802404876C
S7305306526100100802805682B+
S8301040803280100802605284B+
S93053570288060602004068C
S1030154085348080802404882B+
S11305306526801001002805682B+
S1230530652610080802805682B+
S133015408534100100802805690A
S143010408032100100802805688A-
S15301040803210080802605284B+
S163054075301001001003006090A
S173053570288060602004068C
S183053065266060601803662C-
S193015388333.210080802805689.2A-

图3-4- 3第九课《父母与孩子之间的爱》形成性评估成绩统计

形成性评估测试型工具对语文教学的反拨作用研究

根据数据统计,本次评估成绩中,无F(不及格)人数。整体成绩比上一次成绩有很大的进步。B+和C成绩的同学占大多数。

我们认为,同学们的成绩有很大提升,原因是我们对本篇课文的教学方法有些变化,主要由学生讲,老师作补充,这样学生的课堂参与度就提升很多,效果也相当不错。我们认为以后可以多采用类似的课堂学习形式。但由于下一篇课文是文言文类文章,难度相当高,我们决定不要求学生做报告。但鼓励同学们继续积极发言和讨论。

第十一课《廉颇蔺相如列传》表3-4- 4第十一课《廉颇蔺相如列传》形成性评估数据

课标:第十一课《廉颇蔺相如列传》
学生 课堂表现 测试分数 总平均分 等级
课堂出勤

(30%)

主动发言(30%)作业评价(40%)总分占比例40%测试1测试2测试3总分占比例60%
S13010307028100100802805684B+
S23003060248060602004064C-
S33003060248060602004064C-
S43002555226040601602244F
S530103070281001001003006088A-
S6300306024801001002805680B
S73053065261001001003006086A-
S83003565261001001003006086A-
S930525602410080802605276B-
S103003060241001001003006084B+
S113010256526100801002805682B+
S123003060241001001003006084B+
S1330103070281001001003006088A-
S1430103070281001001003006088A-
S153010357530100100802805686A-
S1630030602410080802605276B-
S17250285321.2100801002805677.2B-
S1830525602410080802605266C
S1930103070281001001003006088A-

图3-4- 4第十一课《廉颇蔺相如列传》形成性评估成绩统计

形成性评估测试型工具对语文教学的反拨作用研究

根据数据显示,本次评估成绩中,得A成绩的比率与上次相比有增多了21%,可以说整体成绩有很大的提高,可惜的是有一位同学不及格。另外C-成绩的学生有两位,根据上面的数据分析,他们的测试成绩不是很好,也不排除受到文言文课文难度的影响。本次课堂表现评价中的“主动发言”一项成绩比上次低,但是比上上一次高,由于上次是做报告,他们发言的次数相对会多一些,虽然这次没有做报告,但是课堂表现成绩也不算是很差。

决定调整:为增加课堂活动,加强语言表达能力,决定下周进行一次主题辩论。辩论活动分两轮进行,要求所有同学都参与,请同学们分组并做好准备。

第十二课《苏武传》表3-4- 5第十二课《苏武传》形成性评估数据

课标:第十二课《苏武传》
学生 课堂表现 测试分数 总平均分 等级
课堂出勤

(30%)

主动发言(30%)作业评价(40%)总分占比例40%测试1测试2测试3总分占比例60%
S130104080321001001003006092A
S2305387329.21001001003006089.2A-
S3305387329.2100100802805685.2A-
S4305367128.410080802605280.4B
S530154085341001001003006094A
S6305387329.21001001003006089.2A-
S730104080321001001003006092A
S830104080321001001003006092A
S9301035753010080802605282B+
S103010408032100100802805688A-
S113010387831.21001001003006091.2A
S1230104080321001001002805688A-
S13301540853410080802805690A
S1430154085341001001003006094A
S1530104080321001001003006092A
S1630540753010080802805686A-
S172553570281001001003006088A-
S183053570288080802404876B-
S19301540853410080802805690A

图3-4- 5第十二课《苏武传》形成性评估成绩统计

形成性评估测试型工具对语文教学的反拨作用研究

根据数据显示,本次评估成绩中,A+和A-成绩的学生占比率相当大,A成绩人数占48%,A-成绩人数占37%,同时B+、B、B-成绩的学生分别各1人。没有C以下的学生,也没有F(不及格)的学生。总体成绩比前面几篇课文的评估成绩有很大的提高。

据数据分析,我们可以看到本次评估成绩中的课堂表现评价分数也有很多的进步,原因是我们组织了一次辩论活动,辩论过程中同学们也比较积极参与,效果相当不错。另外三次测试成绩也明显提高。对于本次评估成绩有很大提升的原因,我们认为原因是同学们经过上一次文言文阅读,同学们对文言文的文章已经比较熟悉,难度也会下降,于是对课文内容掌握得不错。

3.4形成性评估运用过程小结

我们在整个评估过程进行了五篇课文教学的评估,共15次测试和5次课堂表现评价,通过对同学们跟踪研究的整个评估过程,如下图所示,在五次评估当中,同学们的总平均成绩有所上涨,我们认为形成性评估测试型工具实施效果基本符合本研究理念。

形成性评估测试型工具对语文教学的反拨作用研究

图表 3-1 五次评估总平均成绩曲线表

在柬埔寨华文学校语文课堂中运用形成性评估测试型工具,有助于教师及时发现教学存在的不足,了解学生的接受程度并及时调整教学计划。由于经验和精力不足,笔者尚未成功调动课堂气氛,根据以上数据也可以看到,同学们的课堂参与度还不是很足,这需要教师继续努力调动课堂讨论,设计更多有趣的课堂活动来吸引同学们参与课堂学习。

另外由于准备时间有限,笔者在准备评估材料过程中稍微匆促,可能所设计的评估工具和测试工具的效度不是很高,主观性较强,后期再使用时需要作出一些改善。同时由于上课时间只有40分钟一节课,笔者同时要兼顾教学进度又要完成评估任务,再加上有些同学缺席,导致材料收集并不是很齐全,后期还要向学生要求补上。

笔者在向同学们介绍形成性评估的时候可能没有解释清楚或者不全面,导致学生对形成性评估还是比较陌生,在进行评估材料收集过程,学生也比较被动,对我们的实践工作进度也有一定的影响。

4形成性评估测试型工具对语文教学的反拨研究

在完成整个形成性评估测试型工具的实施后,本研究需要解释形成性评估测试型工具与课堂教学之间的关系。Hughes(1989)在研究该领域时,认为大纲设计者、教材编写者、学员以及教师均为参与主体。Bailey(1996)在研究过程中,明确指出应试策略、学习策略、教学内容、教学方法、大纲设计以及教材研发等领域的完善,都属于参与者的“参与过程”。

因此,下面我们对测试参与者进行反拨作用研究,研究内容和内容分别是:对学习者“个体差异”的反拨;对教师“教学方法、计划”的反拨;对教学管理者和教材编写者的反拨。

4.1对学习者个体差异的反拨研究

4.1.1研究工具

自从二十世纪七十年代开始,二语教学更加强调“以学习者为中心”。形成性评估同样也强调“以学习者为中心”,它关注学生学习过程中的情况,争取及时发现学生学习中的优劣点并调整教学计划。

第二语言习得理论研究有两条主要线索,分别是关于学习本身的研究和关于学习者个体差异的研究。

Dörnyei(2005)在研究过程中,认为学员的学习态度、学习状态以及学习效率存在较大的差异性,这种现象被称为个体差异性。需要注意的是,年龄、性别、学习策略、语言学能、焦虑以及学习动机等因素,都会对个体差异构成显著影响。学习者存在着明显的个体差异,学习者的学习进展和成绩的不同只能通过个体差异来解释。

为有效结合反拨作用研究,本文将“个体差异”的变化情况作为测试参与者(学生)在使用形成性评估时的反拨作用。

个体差异可分为两种因素:“情感状态”和“一般差异”。

情感因素主要包括动机、焦虑、自信、态度、信念和社会距离等方面。虽然它深藏在学习者内部,但对于二语学习却有着重要的影响;一般因素主要包括学习者的年龄、性别、学习风格、学能、性格等相对稳定的因素。

如上所述,学习者的个体差异所构成的要素数量很多,受到研究时间和条件的限制,我们不能在一个研究项目中把所有变量都包括在内,而只能把精力集中在最基本的核心要素上面。本文综合上述因素,确定选取“学习焦虑”“学习动机”“学习策略和风格”“努力程度”四个核心要素作为本研究对象,设计出一套《语文学习者个体差异调查量表》,在评估实施过程中进行前期和后期两次测量,以获得在一个学段内受试的这些变量的变化情况,以期了解形成性评估测试工具的实施是否影响个体差异。

在量表工具的选择上,我们重点考虑了有效性,被广泛采用而且被证明具有很强的可靠性和有效性的测量工具。另外,为了尽量减少测量所耗的时间,我们根据研究实际情况对各个测量工具进行了删减与合并,以避免出现重复的题目。

在研究过程中,笔者选取李克特五级量表计量方法为基础,设计了61个问题。需要注意的是,每个问题共有五个选项,包含为“完全同意”、“比较同意”、“一般”、“不同意”以及“完全不同意”,分别标记为1、2、3、4、5,被试根据符合自己的实际情况作出选择。

本调查量表包括以下五个部分:

一、学习焦虑量表

从实际情况来看,第二语言焦虑较为特殊。究其原因,学员会对课堂行为、课堂情感以及部分自我意识感到焦虑。

Mizruchi(1991)在研究相关领域时,明确指出去曲线效应是焦虑的特点。简单来说,过度焦虑不利于学员的健康成长。在使用第二语言时也会引起焦虑,但似乎主要限于听和说,这也反映了学习者在不得不用第二语言主动交际时,会产生焦虑 (Horwitz &Cope:1986)。

本量表的设计,是基于“FLCAS外语课堂焦虑量表”的内容进行改编。Horwitz(1986)在研究该领域时,设计了FLCAS、需要注意的是,FLCAS是“外语课堂焦虑量表”的简称。由于该表的效度与信度较高,不仅获得了学界的认可,还被广泛应用到现实生活中。量表内容分别考察学习者的“对沟通的焦虑”“对同学和老师反馈意见的焦虑”以及“对课堂活动、考试焦虑”三个维度。

在我们的量表工具中,语文学习焦虑量表共由16个问题组成,分别考察学生对语言沟通的焦虑、对反馈意见的焦虑、对课堂活动的焦虑以及对考试的焦虑。

二、学习策略/风格量表

从实际情况来看,语言的学习与学习策略密切相关。究其原因,学员自我构建语言系统离不开学习策略的支持(Rubin:1983)。

(Dörnyei, 2009)将学习策略总结了以下四种学习策略:(1)在学习过程中,学员采用转换以及信息加工等方式,整合梳理相关材料,被称为认知策略。需要注意的是,记笔记、分析以及推理是他们的主要学习方式;监控、评价、计划以及分析整个学习过程,被称为元认知策略;(3)社会策略,指学习者旨在增加自己使用目标语言进行交际的行为;(4)情感策略,指学习者对自身情感状态的控制与管理。

从实际情况来看,学员在接受新知识的过程中,都有一定的规律。而这种现象被称为认知方式,也就是所谓的学习风格。需要注意的是,学员的学习风格与教学内容以及教学模式密切相关。除此之外,学员之间的学习风格各不相同。在实践过程中,后天因素与先天因素共同构成了学习风格。另外,学习任务与学习场合的变化,会对学习策略构成较为明显的影响(崔刚:2016)。

学习风格可分为四种学习风格类型(Reid,1987),具体包括动觉、触觉、听觉以及视觉。以视觉型学员为例,他们倾向于通过观看的学习方式来获取学习内容时他们会觉得轻松和愉快,而且学习效果更好。由于部分学员更倾向于听觉输入,他们的学习风格为听觉型。需要注意的是,此类学员喜欢听讲座、口头讲解和与人进行口头的交流。触觉型的学习者喜欢通过触及实物来学习,他们擅长通过动手操作,例如写、画等来学习新的内容。而动觉型的学习者则喜欢全身心地投入到某种学习环境,他们好动不好静,说话时表情丰富,喜欢使用手势和其他肢体语言,可以通过动手和亲身体验来获得最佳的学习效果。

学习风格与学习策略关系紧密。Reid(1995)在研究相关领域时,明确指出学员在学习策略时,多半会受到学习风格的影响。除此之外,学习风格的数量与学习策略呈正相关。Cohen(1998)在研究过程中,认为学习风格是学习策略的外在体现形式。与此同时,学习策略也会受到学习风格的影响。因此,我们决定将学习策略和学习风格放到一起。

我们的量表设计中,借鉴了Oxford(1990)发明的语言学习策略量表,以及Reid(1987)的知觉学习风格偏好问卷(Perceptual Learning Styles Preference Questionnaire,PLSPQ)这两个量表在语言学习策略和风格研究中是使用较广泛的标准测量表。

在我们的量表中,学习策略/风格量表共由25个问题组成,测量内容分别涉及认知、社会、情感以及元认知等类型的学习策略,以及听觉、动觉、触觉以及视觉四种类型的学习风格。

三、学习动机

使人坚持行动、持续付出、启动行为以及做出抉择的东西被称为动机(Dörnyei, Z., & Ushioda,2001)。“选择某种行为”“坚持”和“努力”是动机的三要素(赵杨:2015)。

Lambert、Gardner(1972)在研究相关领域时,选取社会心理学为切入点,认为工具型动机与融入型动机是动机的全部类型;前者指学习者学习目的在于获取经济或其他收益,如升学、就业等;后者指学员以融入对方的民族文化为目标,主动学习相关知识。

Deci&Ryan(1985)在研究过程中,选取心理学自我决定为切入点,认为内在动机与外在动机是动机的全部类型。前者与外部因素密切相关,简单来说,学员为了达到某种目的,被迫学习相关知识;后者与内在需求密切相关,例如:学习能够提升学员的幸福感。(赵杨:2015)。

学习动机量表,我们主要采用Lambert与Gardner(1972,1959)发明的“态度动机调查量表”。

在我们的量表中,学习动机量表共由13个问题组成,量表内容涉及:对目的语国家文化的态度、对讲目的语人的态度、对目的语的兴趣、对目的语所持的态度、以及融入型动机和工具型动机。

四、努力程度

“选择某种行为”“坚持”和“努力”是动机的三要素。崔刚(2016)认为应该把“努力”视为一个独立的个体差异变量,作者的理由是:(1)努力程度与动机存在着行为和心理层面的差异。(2)外语学习历来强调学习者要付出相当的努力,它很可能会对学习成绩产生更为直接的影响。我们可以通过学习者在学习上所花费时间的长短、克服学习中遇到困难的决心、持续进行学习的毅力等来衡量其的努力程度。

努力程度量表共包括7个问题,其中6项是选自于A/MTB量表,另外一项是我们添加的关于学习时间的问题。这样,我们可以知道学生克服学习困难的决心、所付出的学习时间和持续进行学习的时间三个方面。

五、基本信息

基本信息,主要收集学生的姓名、年龄、性别,以及是否华裔。在本调查量表中,我们没有选择匿名的方式进行收集,是为了方便后期将此数据与受试的形成性评估测试分数进行对照和分析。

4.1.2受试的基本情况

本研究以公立崇正学校专修部语文课为例,参与研究的同学为该校专二下班的全体同学,共19名学生。其中,男性6名,占全班的31.58%,女性13名,占全班的68.42%。全班年龄范围在16~19岁,平均年龄为17.5岁。大部分学生为华裔背景,其中15名同学为华裔,占全班人数的78.95%。

由于专修班学生人数较少,我们的受试人数也有限,无法做定量研究,仅能做班级个案跟踪研究。

下列表格是受试的基本信息:

表4- 1受试基本情况

总数 19
性别 男:6(31.58%)

女:13(68.42%)

年龄范围:16~19岁

平均:17.5岁

是否华裔华裔:15(78.95%)

非华裔:4(21.05%)

4.1.3数据收集

数据的收集分别在实施形成性评估测试型工具的前后两次,第一次收集为2020年11月2日,第二次收集为2020年12月28日,时间跨越8周的时间。

前期的测量,我们是在正式实施形成性评估测试型工具之前收集的;后期的测量,是在形成性评估测试型工具实施结束之后进行收集。

下列表格为数据收集的时间安排:

表4- 2数据收集的时间安排表

阶段 时间 项目 是否需要
前期 2020-11-2 学习者个体差异调查量表Ⅰ
中期 2020-11-3~2020-12-26 形成性评估测试型工具实施过程
后期 2020-12-28 学习者个体差异调查量表Ⅱ

4.1.4配对t检验分析

为了回答形成性评估测试型工具的实施是否对学习者个体差异产生影响,我们将使用SPSS软件对前后两次量表的数据进行两配对样本t检验,采用样本配对的方式,将19名学生的总体均值进行对比。一级标题为评估前测量数据;二级标题为评估后测量数据

一、学习焦虑

量表中,学习焦虑因素共由16题组成,即第1~16题,分别测学习者对沟通的焦虑、对反馈的焦虑、课堂活动和考试的焦虑。其中,第1、3题为沟通焦虑;第4、6为对反馈的焦虑;第2、5、7、8、9、10、11、12、13题为课堂活动;14、15、16题为对考试的焦虑。

通过使用spss进行两配对样本t检验,得出如下表格数据:

表4- 3焦虑-成对样本检验表

成对差分 t Sig.(双侧)
均值 标准差 均值的标准误 差分的 95% 置信区间
下限 上限
对 1 标题1.1 – 标题2.1 .000 .333 .076 -.161 .161 .000 1.000
对 2 标题1.2 – 标题2.2 -.263 .653 .150 -.578 .052 -1.756 .096
对 3 标题1.3 – 标题2.3 -.053 .405 .093 -.248 .142 -.567 .578
对 5 标题1.5 – 标题2.5 -.263 .562 .129 -.534 .008 -2.041 .056
对 6 标题1.6 – 标题2.6 -.053 .405 .093 -.248 .142 -.567 .578
对 7 标题1.7 – 标题2.7 -.421 .507 .116 -.666 -.177 -3.618 .002**
对 8 标题1.8 – 标题2.8 -.053 .621 .143 -.352 .247 -.369 .716
对 9 标题1.9 – 标题2.9 -.158 .375 .086 -.338 .023 -1.837 .083
对 11 标题1.11 – 标题2.11 -.158 .501 .115 -.400 .084 -1.372 .187
对 12 标题1.12 – 标题2.12 -.526 .697 .160 -.862 -.191 -3.293 .004**
对 13 标题1.13 – 标题2.13 -.632 .597 .137 -.919 -.344 -4.609 .000**
对 14 标题1.14 – 标题2.14 -1.211 .787 .181 -1.590 -.831 -6.702 .000**
对 15 标题1.15 – 标题2.15 -.316 .478 .110 -.546 -.086 -2.882 .010**
对 16 标题1.16 – 标题2.16 -.263 .452 .104 -.481 -.045 -2.535 .021*

*p<0.05**p<0.01; 一级标题为评估前测 二级标题为评估后测

从上表可知,利用配对t检验去研究前后两次量表数据的差异性,在以上16组配对数据中,有6组配对数据呈现出显著性差异(p<0.05 )。具体分析如下:

标题1.7和标题2.7之间呈现出0.01水平的显著性(t=-3.618,p=0.002),以及具体对比差异可知,标题1.7的平均值(3.21),会明显低于标题2.7的平均值(3.63)。

标题1.12和标题2.12之间,存在0.01水平的显著性(t=-3.293,p=0.004),经计算,3.26是标题2.12的平均值,2.74是标题1.12的平均值。由此可见,前者明显高于后者。

标题1.13和标题2.13之间,存在0.01水平的显著性(t=-4.609,p=0.000),经计算,2.42是标题2.13的平均值,1.79是标题1.13的平均值。由此可见,前者明显高于后者。

标题1.14和标题2.14之间,存在0.01水平的显著性(t=-6.702,p=0.000),经计算,4.00是标题2.14的平均值,2.79是标题1.18的平均值。由此可见,前者明显高于后者。

标题1.15和标题2.15之间,存在0.01水平的显著性(t=-2.882,p=0.010),经计算,3.42是标题2.15的平均值,3.11是标题1.15的平均值。由此可见,前者明显高于后者。

标题1.16和标题2.16之间,存在0.05水平的显著性(t=-2.535,p=0.021),经计算,2.58是标题2.16的平均值,2.32是标题1.16的平均值。由此可见,前者明显高于后者。

根据以上数据分析,我们认为学习者在接受形成性评估测试型工具的实施后,对学习者的部分焦虑因素有所影响,焦虑值有所提升,也就是说在接受形成性评估测试型工具之后,学生的焦虑值有所提升。

呈现显著性差异的“课堂活动焦虑”有第7、12、13题,具体问题分别是:

(7)老师问事先没有准备的问题时感到紧张。

(12)语文课的进度很快,我担心跟不上。

(13)我上语文课比上其它课更紧张和不安。

呈现显著性差异的“考试焦虑”有第14、15、16题,具体问题分别是:

对语文课上的一些小测验感到不放松。我担心语文课上不及格带来的后果。语文/汉语考试准备得越多越觉得没底。因此,我们认为,形成性评估测试型工具对学习者个体差异中的焦虑因素的影响是“课堂活动焦虑”及“考试焦虑”,而“沟通焦虑”并没有受影响。

二、学习策略/风格

量表中,学习策略及学习风格因素共由25个问题组成,即第17~41题。测量内容分别涉及认知策略、元认知策略、情感策略三种学习策略;除此之外,涉及到的学习风格分别为触觉、动觉、听觉以及视觉四种类型。

第17、18、21、22、23、24、29、30、31、32、33、34、37、39、41题为学习策略选项,其中第17、18、22、34题为认知策略,第21、24、29、30、31、32、33、39题为元认知策略,第23、38、41题为情感策略。

第19、20、25、26、27、28、35、36、38、40题为学习风格选项,其中,触觉型学习风格包含19、20、27、36,视觉型学习风格包含第25、26题,动觉型学习风格为第35题,第38、40题为听觉型学习风格。

通过spss进行两配对样本t检验,得出如下表格数据:

表4- 4学习策略/风格-成对样本检验表

成对差分 t Sig.(双侧)
均值 标准差 均值的标准误 差分的 95% 置信区间
下限 上限
对 1 标题1.17 – 标题2.17 .053 .229 .053 -.058 .163 1.000 .331
对 2 标题1.18 – 标题2.18 .211 .419 .096 .009 .412 2.191 .042*
对 3 标题1.19 – 标题2.19 -.211 .535 .123 -.469 .047 -1.714 .104
对 4 标题1.20 – 标题2.20 -.526 .513 .118 -.774 -.279 -4.472 .000**
对 5 标题1.21 – 标题2.21 -.316 .749 .172 -.677 .045 -1.837 .083
对 6 标题1.22 – 标题2.22 -.737 .653 .150 -1.052 -.422 -4.916 .000**
对 7 标题1.23 – 标题2.23 -.158 .375 .086 -.338 .023 -1.837 .083
对 8 标题1.24 – 标题2.24 -.105 .315 .072 -.257 .047 -1.455 .163
对 9 标题1.25 – 标题2.25 -.105 .875 .201 -.527 .317 -.524 .607
对 10 标题1.26 – 标题2.26 -.053 .405 .093 -.248 .142 -.567 .578
对 11 标题1.27 – 标题2.27 .105 .737 .169 -.250 .461 .622 .542
对 12 标题1.28 – 标题2.28 -.579 .692 .159 -.913 -.245 -3.644 .002**
对 13 标题1.29 – 标题2.29 -1.105 .459 .105 -1.326 -.884 -10.500 .000**
对 14 标题1.30 – 标题2.30 -.895 .809 .186 -1.285 -.505 -4.819 .000**
对 15 标题1.31 – 标题2.31 .000 .333 .076 -.161 .161 .000 1.000
对 16 标题1.32 – 标题2.32 -1.474 .513 .118 -1.721 -1.226 -12.522 .000**
对 17 标题1.33 – 标题2.33 .000 .577 .132 -.278 .278 .000 1.000
对 18 标题1.34 – 标题2.34 -.474 .612 .140 -.769 -.179 -3.375 .003**
对 19 标题1.35 – 标题2.35 -.684 .749 .172 -1.045 -.323 -3.980 .001**
对 20 标题1.36 – 标题2.36 -.579 .692 .159 -.913 -.245 -3.644 .002**
对 21 标题1.37 – 标题2.37 -.316 .582 .134 -.596 -.035 -2.364 .030*
对 22 标题1.38 – 标题2.38 -.263 .562 .129 -.534 .008 -2.041 .056
对 23 标题1.39 – 标题2.39 .000 .333 .076 -.161 .161 .000 1.000
对 24 标题1.40 – 标题2.40 -.053 .229 .053 -.163 .058 -1.000 .331
对 25 标题1.41 – 标题2.41 -.316 .582 .134 -.596 -.035 -2.364 .030*

*p<0.05**p<0.01; 一级标题为评估前测 二级标题为评估后测

从上表可知,利用配对t检验去研究前后两次量表数据的差异性,在以上25组配对数据中,有12组配对数据呈现出显著性差异(p<0.05 )。具体分析如下:

标题1.18和标题2.18之间,存在0.05水平的显著性(t=2.191,p=0.042),经计算,2.47是标题2.18的平均值,2.68是标题1.18的平均值。由此可见,前者明显高于后者。

标题1.20和标题2.20之间,存在0.01水平的显著性(t=-4.472,p=0.000),经计算,3.74是标题2.20的平均值,3.21是标题1.20的平均值。由此可见,前者明显高于后者。

标题1.22和标题2.22之间,存在0.01水平的显著性(t=-4.916,p=0.000),经计算,3.16是标题2.22的平均值,3.89是标题1.22的平均值。由此可见,前者明显高于后者。

标题1.28和标题2.28之间,存在0.01水平的显著性(t=-3.644,p=0.002),经计算,3.95是标题2.28的平均值,3.37是标题1.28的平均值。由此可见,前者明显高于后者。

标题1.29和标题2.29之间,存在0.01水平的显著性(t=-10.500,p=0.000),经计算,4.37是标题2.29的平均值,3.26是标题1.29的平均值。由此可见,前者明显高于后者。

标题1.30和标题2.30之间,存在0.01水平的显著性(t=-4.819,p=0.000),经计算,4.68是标题2.30的平均值,3.79是标题1.30的平均值。由此可见,前者明显高于后者。

标题1.32和标题2.32之间,存在0.01水平的显著性(t=-12.522,p=0.000),经计算,4.53是标题2.32的平均值,3.05是标题1.32的平均值。由此可见,前者明显高于后者。

标题1.34和标题2.34之间,存在0.01水平的显著性(t=-3.375,p=0.003),经计算,4.16是标题2.34的平均值,3.68是标题1.34的平均值。由此可见,前者明显高于后者。

标题1.35和标题2.35之间,存在0.01水平的显著性(t=-3.980,p=0.001),经计算,2.35是标题2.35的平均值,2.26是标题1.35的平均值。由此可见,前者明显高于后者。

标题1.36和标题2.36之间,存在0.01水平的显著性(t=-3.644,p=0.002),经计算,3.32是标题2.36的平均值,2.74是标题1.36的平均值。由此可见,前者明显高于后者。

标题1.37和标题2.37之间,存在0.05水平的显著性(t=-2.364,p=0.030),经计算,3.47是标题2.37的平均值,3.16是标题1.37的平均值。由此可见,前者明显高于后者。

标题1.41和标题2.41之间,存在0.05水平的显著性(t=-2.364,p=0.030),经计算,2.84是标题2.41的平均值,2.53是标题1.41的平均值。由此可见,前者明显高于后者。

根据以上数据分析,我们认为学习者在接受形成性评估测试型工具的实施后,对学习者的部分学习风格和学习策略因素有所影响,有12项因素的数值明显增高,也就说明对应增值的学习策略或学习风格变得更加明显或频率增多。

其中,呈现显著性差异的“学习认知策略”有18、22、34题,具体问题分别是:

(18)记单词时,我经常联想单词对应的图像。

(22)读课文时,我总是争取弄懂课文里的每一处。

(34)遇到不理解的词语,我会马上向同学求助或查词典、百度等。

呈现显著性差异的“元认知策略”有第29、30、32题,具体问题分别是:

(29)我习惯为第二天的课程做好预习。

(30)我很重视自己犯的汉语错误,并认真改正。

(32)我经常评估自己的汉语学习进展,找出薄弱的环节。

呈现显著性差异的“情感策略”有第37、41题,具体问题分别是:

当我参与课堂活动时,我的学习效率更好。在课堂上,我会主动发言或提问。呈现显著性差异的“触觉型学习风格”有第20、28、36题,具体问题分别是:

(20)我经常练习普通话发音。

(28)为了更好理解课文,我在课文内容上写中文注释。

(36)我喜欢记笔记,或用笔写出自己的思路。

呈现显著性差异的“动觉型学习风格”是第35题,具体问题是:

(35)我喜欢参加各种课堂活动,如主题讨论、演讲、辩论等。

因此,我们认为,形成性评估测试型工具对学习者个体差异中的学习风格和策略因素是有影响的。其中,认知策略、元认知策略和情感策略均有影响。另外,学习风格方面,有3项触觉和一项动觉型风格产生影响,而听觉和视觉型学习风格均无产生影响。

三、学习动机

量表中,学习动机因素共由13个问题组成,即第42~54题。量表内容涉及:对汉语的学习兴趣、对中国人的态度、对中国文化的态度、对目的语所持的态度、以及融入型动机和工具型动机。

通过spss进行两配对样本t检验,得出如下表格数据:

表4- 5学习动机-成对样本检验表

成对差分 t Sig.(双侧)
均值 标准差 均值的标准误 差分的 95% 置信区间
下限 上限
对 1 标题1.42 – 标题2.42 -.053 .229 .053 -.163 .058 -1.000 .331
对 2 标题1.43 – 标题2.43 -.211 .419 .096 -.412 -.009 -2.191 .042*
对 3 标题1.44 – 标题2.44 -.053 .229 .053 -.163 .058 -1.000 .331
对 4 标题1.45 – 标题2.45 -.053 .229 .053 -.163 .058 -1.000 .331
对 5 标题1.46 – 标题2.46 -.105 .315 .072 -.257 .047 -1.455 .163
对 6 标题1.47 – 标题2.47 .053 .229 .053 -.058 .163 1.000 .331
对 7 标题1.48 – 标题2.48 -.053 .229 .053 -.163 .058 -1.000 .331
对 8 标题1.49 – 标题2.49 -.316 .946 .217 -.772 .140 -1.455 .163
对 9 标题1.50 – 标题2.50 -.158 .501 .115 -.400 .084 -1.372 .187
对 10 标题1.51 – 标题2.51 .105 .994 .228 -.374 .584 .462 .650
对 13 标题1.54 – 标题2.54 .053 .405 .093 -.142 .248 .567 .578

*p<0.05**p<0.01; 一级标题为评估前测 二级标题为评估后测

从上表可知,利用配对t检验去研究前后两次量表数据的差异性,在以上13组配对数据中,仅有一组配对呈现出显著性差异(p<0.05)。具体分析如下:

标题1.43和标题2.43之间,存在0.05水平的显著性(t=-2.191,p=0.042),经计算,4.32是标题2.43的平均值,4.11是标题1.43的平均值。由此可见,前者明显高于后者。

根据以上数据分析,我们认为学习者在接受形成性评估测试型工具的实施后,对学习者的学习动机因素影响不大,在以上数据中显示仅有1项因素的数值有增高,即第43题:我的语文老师讲课很有趣。该项对应的是“对讲目的语人的态度”的学习动机。

因此,形成性评估测试型工具的实施对学习者的目的语国家文化的态度、对目的语的兴趣、对目的语所持的态度、以及融入型动机和工具型等动机并没有显著影响。

四、努力程度

量表中,努力程度因素共由7个问题组成,即第55~61题。量表内容涉及:克服困难的决心、付出的学习时间、持续进行的努力程度。

通过spss进行两配对样本t检验,得出如下表格数据:

表4- 6努力程度-成对样本检验表

成对差分 t Sig.(双侧)
均值 标准差 均值的标准误 差分的 95% 置信区间
下限 上限
对 1 标题1.55 – 标题2.55 -.526 .513 .118 -.774 -.279 -4.472 .000**
对 2 标题1.56 – 标题2.56 -.316 .582 .134 -.596 -.035 -2.364 .030*
对 3 标题1.57 – 标题2.57 -.158 .501 .115 -.400 .084 -1.372 .187
对 4 标题1.58 – 标题2.58 -1.158 .834 .191 -1.560 -.756 -6.050 .000**
对 5 标题1.59 – 标题2.59 -.211 .419 .096 -.412 -.009 -2.191 .042*
对 6 标题1.60 – 标题2.60 -.684 .582 .134 -.965 -.404 -5.121 .000**
对 7 标题1.61 – 标题2.61 -.789 .631 .145 -1.093 -.486 -5.457 .000**

*p<0.05**p<0.01; 一级标题为评估前测 二级标题为评估后测

从上表可知,利用配对t检验去研究前后两次量表数据的差异性,在以上7组配对数据中,其中有6组配对呈现出显著性差异(p<0.05)。具体分析如下:

标题1.55和标题2.55之间,存在0.01水平的显著性(t=-4.472,p=0.000)。经计算,4.32是标题2.43的平均值,而4.11是标题1.43的平均值。由此可见,前者明显高于后者。

标题1.56和标题2.56之间,存在0.05水平的显著性(t=-2.364,p=0.030),经计算,3.89是标题2.56的平均值,而3.37是标题1.56的平均值。由此可见,前者明显高于后者。

标题1.58和标题2.58之间,存在0.01水平的显著性(t=-6.050,p=0.000),经计算,4.68是标题2.58的平均值,而3.53是标题1.58的平均值。由此可见,前者明显高于后者。

标题1.59和标题2.59之间,存在0.05水平的显著性(t=-2.191,p=0.042),经计算,3.53是标题2.59的平均值,而3.32是标题1.59的平均值。由此可见,前者明显高于后者。

标题1.60和标题2.60之间,存在0.01水平的显著性(t=-5.121,p=0.000),经计算,4.00是标题2.60的平均值,而3.32是标题1.60的平均值。由此可见,前者明显高于后者。

标题1.61和标题2.61之间,存在0.01水平的显著性(t=-5.457,p=0.000),经计算,3.79是标题2.61的平均值,而3.00是标题1.61的平均值。由此可见,前者明显高于后者。

根据以上数据分析,我们认为学习者在接受形成性评估测试型工具的实施后,对学习者的学习努力程度因素影响较大,在以上7组配对数据中就显示有6组数据呈显著差异,仅有一组配对数据无显著差异。

呈现显著性差异的“努力程度”因素有55、56、57、59、60、61题,具体问题分别是:

我学习汉语真的很努力。我总能排除一切干扰,集中精力完成学习任务。(58)当老师反馈测验结果时,我都会认真看,并反思。

(59)上课时,我总是集中注意力认真听讲。

(60)对于比较复杂的语文/汉语知识,我也会努力学到明白为止。

(61)最近一个月,你课外平均每天花多长时间学习语文/汉语?

以上6个问题均呈显著性差异。因此,我们认为形成性评估测试型工具的实施对学习者的努力程度有较明显的影响,说明其能促进学生努力学习。

4.2对教学过程的反拨

根据PPP反拨效应模型理论指出,受到测试的反拨除了教师和学生外,还有教学过程,包括参与者为促进语言教学而进行的任何活动,如教学大纲、教学方法或内容的调整等。经过为期8周时间的形成性评估测试型工具的实施,我们认为形成性评估测试型工具对我们教学过程中产生一定的反拨作用,我们总结如下:

教学方法和形式变得更加活跃。由于学生参与课堂讨论较少,我们决定临时增添辩论活动和课文阅读报告等,鼓励同学们多多主动发言,这使得课堂教学形式变得更加活跃起来。调整教学计划。通过对测试成绩的观察,我们发现学生对课文掌握不是很好,于是决定暂时不继续讲解新内容,而借用一节课时间给学生作补充。课堂教学进度变慢。由于临时增加课堂活动,无法与教学进度表同步进行,使最后一篇课文的教学时间较紧张。调整评估制度。由于形成性评估测试次数频繁,经过与同学们商量,决定取消学校原规定的平测制度(学校要求每上完两或三篇课文进行一次平测),将形成性评估测试的成绩代替平测成绩。

4.4反拨作用性质的分析

4.4.1正面的反拨作用

对学习成绩产生正面反拨我们在整个评估过程进行了五篇课文的形成性评估,共5次评估,分别进行了15次测试和5次课堂表现评价,经过对同学们跟踪研究的整个评估过程,如下图所示,学生的总平均成绩逐渐提高,从最低总平均分为44分提升到最低总平均分为76分。总体平均成绩提升了32%。因此,我们认为形成性评估测试工具对学习者的“学习成绩”产生正面反拨作用。

形成性评估测试型工具对语文教学的反拨作用研究

图4- 1五次评估总平均成绩曲线图

对学习者的学习策略/风格产生正面反拨通过运用spss进行的学习者个体差异量表的两配对t检验,我们发现形成性评估测试型工具对学习者部分学习策略产生显著性的影响,量表数值明显比第一次测量的数值高,说明学习者的学习策略明显增强,所产生正面反拨的学习策略和风格分别是:

经常练习普通话习惯为第二天的课程做好预习。重视自己犯的汉语错误,并认真改正。为了更好理解课文,在课文内容上写中文注释。经常评估自己的汉语学习进展,找出薄弱的环节。遇到不理解的词语,马上向同学求助或查词典、百度。喜欢记笔记,用笔写出自己的思路。在课堂上,会主动发言或提问。

对学习者的努力程度产生正面反拨通过运用spss进行的学习者个体差异量表的两配对t检验,我们发现形成性评估测试型工具对学习者努力程度产生显著性的影响,量表数值明显比第一次测量的数值高,说明学习者的努力程度明显增强,即正面反拨,分别是:

总能排除一切干扰,集中精力完成学习任务。当老师反馈测验结果时,都会认真看,并反思。上课时,总是集中注意力认真听讲。对比较复杂的语文/汉语知识,会努力学到明白为止。平均每天花在学习语文/汉语的时间平均增多。

4.4.2负面的反拨作用

通过运用spss进行的学习者个体差异量表的两配对t检验,我们发现形成性评估测试型工具对学习者的学习焦虑产生显著性影响,量表数值明显比第一次测量的数值高,说明的焦虑程度明显增强,受反拨的学习焦虑分别是:

老师问事先没有准备的问题时感到更加紧张。语文课的进度很快,担心跟不上。上语文课比上其它课更紧张和不安。对语文上的小测验感到不放松。担心语文课上不及格带来的后果。语文考试准备得越多越觉得没底。

5基于访谈对形成性评估实施的评价

5.1学生访谈

此次学生访谈在复习周期间进行,访谈目的是为了了解学生对形成性评估测试型工具实施的看法,希望学生充分表达自己对形成性评估测试型工具的态度和想法。笔者采用非正式的访谈方法,在班级里较随意地跟同学们谈话,访谈内容如下:

你们喜欢形成性评估测试吗?你们觉得自己从形成性评估测试当中有所收获吗?你们觉得形成性评估测试适合用于我们的语文课堂环境下吗?笔者跟同学们谈话后,发现同学们似乎不太喜欢形成性评估测试型工具。大部分同学表示:考试次数太多,有压力。还有同学表示,虽然任务很多,但可以接受,因为课堂学习可以更活跃地根据同学们的水平进行调整,这样就不会觉得语文课很难,对自己提高成绩也有一定的帮助;我们平时都不敢跟老师提出意见和建议,这也给我们机会间接性地向老师提出学习上的难点,老师也可以及时发现教学中存在的问题。

虽然同学们觉得考试量多了一些,有压力,但他们还是表示有所收获。有同学表示:由于考试内容是考察课文内容理解情况的,我们平时上课也会更加认真听讲,避免考试时不会做题,另外因为考试考得比较及时,对我们来说也是给我们复习一遍课文的机会,有时候在听课过程好像没怎么搞明白,考完试后就捋清楚了。

也有同学表示在期末考试时候不会有太大压力,因为平时经常考试,所以及时复习和巩固了所学知识。

对于形成性评估测试型工具是否适用于该教学环境,同学们认为可以使用,但是不要考太多。

5.2校领导访谈

此次校领导访谈也是在复习周进行。本次访谈的对象为公立崇正学校教务处主任高文胜老师。访谈目的是为了了解学校领导如何看待在该校实施形成性评估测试型工具,希望高主任充分表达自己对形成性评估测试型工具的态度和想法。访谈内容如下:

您觉得形成性评估测试型工具适合用于我们的专修语文课程的教学吗?您觉得可能会实施形成性评估测试型工具会遇到哪些挑战?学校是否能允许老师们用形成性评估测试型工具?高主任表示很支持在专修班实施形成性评估测试型工具,但是由于专修班语文老师大部分为学校语文组组长,工作量多,可能老师们没有时间准备评估工作,而且老师们的教学方法和模式都已经固定了,我们很难要求老师们去改变。高主任认为形成性评估测试型工具更适合年轻老师使用,他鼓励年轻教师多尝试新的教学方法,适当使用形成性评估方法。

5.3小结

通过对学生和学校领导进行访谈,发现虽然他们支持形成性评估在该校实施,但是由于各种客观原因,如:教学时间紧张、教学模式固定化等,导致形成性评估暂时还不适合在该校全面实施。

6华文教育中语文教学形成性评估的局限性及对策

6.1语文教学形成性评估的局限性

形成性评估虽然被证明有效促进教学效果,但是一直很少被推广,这说明形成性评估方法不是适用于所有的教学环境,或是存在一定的利弊,可能实施过程中遇到问题,或是时间不够,或是学生不太愿意配合等局限。

在柬埔寨华文教育这样以传统的“考试为导向”教育环境下实施“以学习为导向”的形成性评估,必然会有一些局限性。经过我们为期八周时间的班级跟踪研究,我们认为柬埔寨语文课堂形成性评估测试型工具实施的局限性有如下几点:

固定的传统教学模式和体系多年来,柬埔寨华文学校的教学与考试模式有着统一体系的固定化,以教师讲解课文为主,学生一般只需要回答一些简单的问题,课堂讨论较少,课文内容讲解完后,课文笔记由教师为学生划重点,考试内容也不会在课文笔记之外,学生只需要背熟笔记里面的内容即可。这样的教学模式阻碍了形成性评估在柬埔寨华文教学的发展,教师过于重视终结性评价,如期中、期末考试,而忽略了学生个体形成性的学习发展,导致学生对平时学习不够重视。同时,由于老师们工作量大,又习惯了自己的教学模式,难以要求老师们改变。

无法保证学生全勤,资料难以收集由于形成性评估资料收集工作繁琐,除了测试外,还有非正式的评估方法,如:自我评估、同伴评估、课堂观察、学生档案袋等方法,一旦有学生缺课,资料收集就不齐全,还需要后期补充材料,这就为教师增添了工作量,需要老师们投入大量的时间和精力,这对不熟悉教学内容的新手教师来说更是一个挑战。

课堂教学时间不利于实施形成性评估语文课堂教学一节课只有40分钟,而且学校的教学进度表安排时间较紧,教师同时要兼顾教学进度又要完成评估任务等。一天仅有一节课,所教学的内容量多、课程进度紧张等问题,导致教师没有足够的时间完成形成性评估相关工作,这不利于形成性评估在柬华文教育中的立足。

6.2改善在柬的语文教学形成性评估的对策和建议

将形成性评估有效结合终结性评估学校首先应该考虑将形成性评估纳入学校的教学体系,动员和组织校内资深教师策划和修改教学大纲,设计形成性评估的操作流程和方法,并说明形成性评估的作用,鼓励老师们调整教学方法和模式。

在儒家文化教育环境下,占据主导地位的是终结性评估,而终结性评估与形成性评估存在较大的冲突。在此基础上,学界必须找到恰当的方式,使两者完美的融合到一起(David Carless,2011)。我们建议学校取消原有的平测制度(校要求每上完两或三篇课文进行一次平测,平测内容为以给学生整理好的笔记内容),以形成性评估测试型工具的成绩为代替。形成性评估的测试实施的间隔时间更短,针对性更强,而平测的内容仅限于笔记内容里面,根本无法准确测量学生的理解情况。为减轻师生的工作量,可取消平测制度,以形成性评估成绩为代替,并将形成性评估成绩结合期中、期末考试成绩进行分数统计。

同时,据我们对同学们访谈的了解,同学们都认为一篇课文进行的三次测试,测试量偏多,也建议适当减少测试数量和内容量,可减少至一篇课文进行两次测量。

形成性评估测试采用线上进行学生缺课是普遍现象,我们难以保证学生人数每天都全齐,而形成性评估测试需要不定期进行数据收集,上完该上的内容就要测,缺席的学生就无法参与课堂测试。我们建议形成性评估测试采用线上进行,使谷歌表单(Google Forms)进行考题编辑。

老师可以把考试链接发到班群里,出勤的同学可以在课堂上统一时间完成测试,请假或缺勤的同学可以在有空的时间完成测试,这样我们就能保证无法到现场的同学也可以完成测试,老师也不用在课堂上花时间监督学生补考。谷歌表单线上测试可以设置自动批改和评分,另外还可以设置自动反馈语,这样也有利于老师方便收集学生的考试成绩,既省时又方便。

三、强调教师对形成性评估实施的作用

Tierney(2006)在研究该领域时,明确表示所有的教学改革都是很艰难。与此同时,评估改革的难度更大。在改革过程中,优先对教师群体改革,才能获得该群体的支持,进而提高评估改革的成功率。

目前,形成性评估对当地教师们来说,是一个教陌生的评估方法,因此,想要得到老师们的支持,首先要让老师们了解形成性评估的作用,鼓励老师们使用形成性评估,我们建议学校层面组织相关讲座,推广形成性评估的实施,并对形成性评估实施的相关经费、物资等给予支持。

6.3柬埔寨华文教育语文教学形成性评估的展望

形成性评估在柬华文教育领域中的展望离不开华文教师们的共同努力,改变传统的教学方法,努力将形成性评估适当地运用到华文教学课堂当中,先从高年级开始,慢慢摸索,从而找到最适合的形成性评估操作方法。

而柬华文教育界领导,如柬华理事总会也应当考虑策划并改变传统的教学模式,将教学面向现代化、国际化的教学模式进行发展,应加强注重学生的个体和形成性的发展,鼓励老师们使用形成性评估,增加课堂师生互动、主题讨论、辩论等,根据学生不同的情况进行选择,从而慢慢将形成性评估应用到教学当中。坚持做到“不是老师教什么学生学什么,而是学生需要学什么教师教什么”的教育理念。

参考文献

  1. 布卢姆.教育评估[M]. 邱渊译. 上海:华东师范大学出版社.1987.
  2. 崔刚,柳鑫淼,杨莉[M]. 动态系统理论视角下的英语学习者个体差异研究,北京:清华大学出版社,2016.
  3. 崔永华,杨寄周. 汉语课堂教学技巧.[M]. 北京:北京语言大学出版社,2009.
  4. 郭熙.华文教学概论[M].北京:商务印书馆,2007:412
  5. 黄光扬.教育测量与评价[M].上海:华东师范大学出版社,2012.2
  6. 贾益民.华文教材教法[M].广州.暨南大学出版社.2012:15-18
  7. 李清华,王伟强,张放.形成性评估研究[M].北京:科学出版社,2014.2.
  8. 罗少茜,黄剑,马晓蕾.促进学习:二语教学中的形成性评价[M].北京:外语教学与研究出版社,2015:114
  9. 莫雷. 教育心理学[M]. 北京:教育科学出版社,2007.
  10. 彭俊. 华文教学研究[M]. 广东:暨南大学出版社,2009.
  11. 王后雄. 教材完全解读. 高中语文.必修4:配人教版[M].西安:陕西师范大学出版总社有限公司,2017.5
  12. 赵杨. 第二语言习得[M].北京:外语教学与研究出版社, 2015.3

期刊:

  1. 毕鹏晖.形成性自我评估融入移动听力学习的模式研究[J].现代教育技术, 2017, 27(12):82-87.
  2. 黄影妮.形成性评价对学生自主学习能力培养的反拨效应[J].福建论坛(社科教育版)2009,(04):161-162.
  3. 贾益民.海外华文教学的若干问题[J].语言文字应用,2007(03):23-26.
  4. 罗少茜,龚亚夫.外语教学研究中的知识、能力与运用能力[J].课程.教材.教法,2005(06):39-44.
  5. 王华,甄凤超.基于语言教学项目的形成性评估流程效果研究和再完善[J]. 外语研究.2008(03)
  6. 王华.外语教学中形成性评估体系的建立[J].当代外语研究,2010(06):48-53.
  7. 形成性评估在外语教学中的应用研究综述[J]. 王华,富长洪.外语界.2006(04)
  8. 外国语大学,2014.杨柳.形成性评价对自主学习的反拨效应研究[J].湖北经济学院学报(人文社会科学版),2013,10(12):196-198.
  9. 朱其韵.《从测试到有效学习:在儒家文化环境下实施形成性评估》评价[J].考试研究,2004.

学位论文:

  1. 郭晓楠.形成性评价对高中英语写作教学的反拨作用研究[D].鲁东大学, 2012.
  2. 刘江娜.形成性评价对高中生英语写作动机和策略的反拨作用研究[D].鲁东大学,2014.
  3. 孙芹. 形成性评价对高中生自主学习反拨效应的实证研究[D].四川师范大学,2013.
  4. 张倩. 柬埔寨华校中学教材《华文》适用性分析及应对策略研究[D].广东外语外贸大学,2016.

附录A

学习者个体差异调查量表

请你结合自己的学习体会,完成调查量表的填写。此外,所有问题均无固定答案,本问卷纯粹作为研究之用,我们会对你提供的所有信息严格保密,请放心填写。谢谢!

请根据你的同意程度在句子右边的数字上打钩()。

(1= 完全不同意 2=不同意 3=一般 4=同意 5=完全同意)

语文/汉语学习焦虑

1 语文课上,没听懂老师用汉语说什么我感到害怕 1 2 3 4 5
2 语文课上做没有准备的发言时感到恐慌 1 2 3 4 5
3 和中国人说汉语感到紧张 1 2 3 4 5
4 在其他同学面前讲汉语会注意怕说错 1 2 3 4 5
5 学汉语要学那么多规则让人感到头疼 1 2 3 4 5
6 我总觉得同学的汉语能力比自己好 1 2 3 4 5
7 老师问事先没有准备的问题时感到紧张 1 2 3 4 5
8 上语文课时经常在想一些与课堂内容无关的事 1 2 3 4 5
9 经常感觉不想去上汉语课 1 2 3 4 5
10 接受提问之前,会感到非常紧张 1 2 3 4 5
11 我觉得课前做好准备会有压力 1 2 3 4 5
12 语文课的进度很快,我担心跟不上 1 2 3 4 5
13 我上语文课比上其它课更紧张和不安 1 2 3 4 5
14 对语文课上的一些小测验感到不放松 1 2 3 4 5
15 我担心语文课上不及格带来的后果 1 2 3 4 5
16 语文/汉语考试准备得越多越觉得没底 1 2 3 4 5

学习策略/风格

17 我经常用新学的单词造句,来加深记忆。 1 2 3 4 5
18 记单词时,我经常联想单词对应的图像。 1 2 3 4 5
19 记单词时,我反复读,或反复写。 1 2 3 4 5
20 我经常练习普通话发音。 1 2 3 4 5
21 我有属于自己的单词本子,当发现生词我会及时记录下来。 1 2 3 4 5
22 读课文时,我总是争取弄懂课文里的每一处。 1 2 3 4 5
23 我课外经常主动与别人说汉语。 1 2 3 4 5
24 我有明确的汉语学习计划和学习目标。 1 2 3 4 5
25 我课外经常看汉语原声电影或电视节目。 1 2 3 4 5
26 我课外经常阅读中文小说、新闻等,这对我来说是乐趣。 1 2 3 4 5
27 为了更好理解课文,我经常在课文内容上标注柬/英文。 1 2 3 4 5
28 为了更好理解课文,我在课文内容上写中文注释。 1 2 3 4 5
29 我习惯为第二天的课程做好预习。 1 2 3 4 5
30 我很重视自己犯的汉语错误,并认真改正。 1 2 3 4 5
31 我总是寻找更好的汉语学习方法。 1 2 3 4 5
32 我经常评估自己的汉语学习进展,找出薄弱的环节。 1 2 3 4 5
33 每当我取得好成绩时,我都会奖励自己。 1 2 3 4 5
34 遇到不理解的词语,我会马上向同学求助或查词典、百度等。 1 2 3 4 5
35 我喜欢参加各种课堂活动,如主题讨论、演讲、辩论等。 1 2 3 4 5
36 我喜欢记笔记,或用笔写出自己的思路。 1 2 3 4 5
37 当我参与课堂活动时,我的学习效率更好。 1 2 3 4 5
38 我更容易记住听到的信息,而不是看到的信息。 1 2 3 4 5
39 对我来说,最高效的学习方式是自学。 1 2 3 4 5
40 对我来说,最高效的学习方式是听别人讲解。 1 2 3 4 5
41 在课堂上,我会主动发言或提问。 1 2 3 4 5

学习动机

42 我真的很喜欢学习汉语/语文。 1 2 3 4 5
43 我的语文老师讲课很有趣。 1 2 3 4 5
44 同其他课相比,我更喜欢语文课的课堂活动。 1 2 3 4 5
45 说真的,我对汉语/语文非常感兴趣。 1 2 3 4 5
46 我非常喜欢中华文化。 1 2 3 4 5
47 我学习汉语是因为父母让我学。 1 2 3 4 5
48 我学汉语,因为它是当今社会非常有用的交流工具。 1 2 3 4 5
49 毕业以后,我想去中国留学。 1 2 3 4 5
50 学好汉语能让我获得成就感。 1 2 3 4 5
51 我觉得学好汉语,让我感到骄傲。 1 2 3 4 5
52 我学汉语是为了将来找一份好工作。 1 2 3 4 5
53 我学汉语是因为我对中国人和中国文化感兴趣。 1 2 3 4 5
54 我学汉语是为了能够与中国人轻松相处。 1 2 3 4 5

努力程度

55 我学习汉语真的很努力。 1 2 3 4 5
56 我总能排除一切干扰,集中精力完成学习任务。 1 2 3 4 5
57 我每天坚持学汉语,更新自己的汉语知识。 1 2 3 4 5
58 当老师反馈测验结果时,我都会认真看,并反思。 1 2 3 4 5
59 上课时,我总是集中注意力认真听讲。 1 2 3 4 5
60 对于比较复杂的语文/汉语知识,我也会努力学到明白为止。 1 2 3 4 5
61 最近一个月,你课外平均每天花多长时间学习语文/汉语?

如:预习、复习、练普通话、阅读中文书籍、看中文节目等。

  1. >120 ; 4. 91-120 ; 3. 61-90 ; 2. 30-60 ; 1. <30)
1 2 3 4 5

基本信息 姓名: 性别:男☐女☐

年龄: 是否华裔:是☐ 否☐

附录B

课标:课堂表现评价表学习委员:
学生 姓名 课堂出勤(30分) 主动发言(30分) 作业评价(40分) 总分(100分)
S1
S2
S3
S4
S5
S6
S7
S8
S9
S10
S11
S12
S13
S14
S15
S16
S17
S18
S19

评分标准

课堂出勤:全勤记30分,迟到一次扣2.5分,缺勤一次扣5分,缺勤次数≥5,记0分。B. 课堂主动发言:每主动发言一次得5分,主动发言次数≥6,记30分。

C. 作业评价:准时提交课程笔记,认真完成,作业字迹整洁,课文背诵流利等,满分40分。

形成性评估测试型工具对语文教学的反拨作用研究

形成性评估测试型工具对语文教学的反拨作用研究

价格 ¥9.90 发布时间 2022年12月6日
已付费?登录刷新
下载提示:

1、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“文章版权申述”(推荐),也可以打举报电话:18735597641(电话支持时间:9:00-18:30)。

2、网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。

3、本站所有内容均由合作方或网友投稿,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务。

原创文章,作者:写文章小能手,如若转载,请注明出处:https://www.447766.cn/chachong/80098.html,

Like (0)
写文章小能手的头像写文章小能手游客
Previous 2022年12月4日
Next 2022年12月6日

相关推荐

My title page contents