社科网首页|客户端|官方微博|报刊投稿|邮箱 中国社会科学网
返回首页
他山之石
国外中学历史教学评价的诸种模式及其对我们的启示
作者:    发布时间:2014/07/30    来源:中学历史教学园地
  字体:(     ) 关闭窗口

  一.美国中学历史教学评价状况 

  美国没有国家统一的课程,课程和其他教育方面的决定,都是在州、学区和学校等层面作出的,从而导致了美国的基础教育在国际比较中处于不利地位。为了改变这一状况,1989年,美国50个州的州长联合发出呼吁,要求联邦政府出面,制定全国性的教育目标,在中小教育的重要科目中实行全国统一的教学标准,保证所有学生都能享受同等质量的教育。由此各重要学科都制定了全国教学标准,《全国历史教学标准》是在1994年颁布的。 

  《标准》一颁布,人们便展开了有关《标准》的全国性辩论,并因此而促进了美国社会对历史教育重要性的认识。1997年,要求尽快实施全国性的教学标准的呼声不但没有削弱,反而更为强烈,连《纽约时报》也疾呼:改革美国教育的出路在于建立全国性的教学标准。与此同时,各州纷纷开始制定新的或改进原有的历史教学标准。1997年以后,除艾奥瓦州外,所有州都已开始制定和实施州的教学标准。虽然各州制定的历史教学标准不尽一致,但大多以《全国历史教学标准》为蓝本或请全国知名的历名学家作顾问。威斯康星州制定的标准,其历史分期即照搬了《全国美国史教学标准》。在《全国历史教学标准》的修订版即将发行前,原版的定购量突然大增。据NCHS的统计,定购原版的人主要是中小学的历史教师,他们显然认为原版对他们的教学有重要的参考价值。 

  之所以认为具有重要的参考价值,是因为在历史教学的评估中采取了“加强推行高标准的统一考试”。尽管这种统一考试在美国引起了很大的争议,引发了一些作弊现象等,但美国政府依然重视这种高标准统一考试的作用,认为不能因为学校质量低下就降低考试标准,而是要促使学校改进教育教学,以使每一个学生逐步达到规定的标准。用低标准来要求处境不利或成绩较差的学生,对这些学生是不公平的,政府和学校的任务就是要使所有的学生达到高标准,因此统一考试是不可或缺的。 

  美国评估与标准开发中心主任Srijati Ananda 分析了这种统一考试的长处与不足以及可能解决的办法。她认为: 

  统一考试的长处在于:(1)能向学生、教师和学校澄清和确立富有挑战性的成绩期望。(2)能突出富人区与穷人区之间,以及不同种族和文化之间的成绩差距,促使地方教育者把注意力集中在普遍性的问题上,尤其是要促使各州根据学生的总体成绩以及处境不利学生群体的成绩来奖惩学区与学校;州学区和学校可以运用评估结果来确定所有学生是否掌握了将来在教育与工作中取得成功所必须的关键性的内容知识和技能,学校行政管理人员和教师可以查明可能的问题并相应地改变课程与教学活动。(3)能促进学生成绩的提高,但是学生成绩的提高取决于是否给予成绩较差的学生提供系统的补习这样显著的支持。 

  统一考试的缺点是:(1)增加了学生的复读率和失败率。当成绩差的后果是复读或不发毕业证书时,决策者必须考虑对学生的直接影响以及对社会的长期影响。如果确定“世界一流”的标准导致无法接受的高失败率(弗吉利亚州第一年实施新的成绩责任制时学校学生的失败率达到97%就是一个极端的例子),决策者和公众就必然会质疑这样一种制度的可信性。因此必须特别注意高要求考试对传统上教育水平低下的学生人口(如特殊教育、低收入、有色人种学生等)的影响。克服这一缺点的办法是:定的标准要高但应是能达到的,然后要考虑系统地逐步提高成绩期望,因此要允许学校和教师的标准整合到课程与教学之中并在掌握之前给予学生学习新概念和技能的时间;为失败的学生或者按照新的高标准有可能失败的学生提供额外的帮助(如暑期学校、个别辅导等);结合运用替代的但同样严格的评估方法来评估在标准化考试中可能处于不利境地的学生,表现为本的评估或者多重选择考试程序的修订(如提供额外的时间)应当给予学生机会以更切合自己学习和反应风格的方式证明自己掌握了同样高的标准。 

  (2)统一考试会使教学和评估的范围狭窄化。大规模的考试正在缩小课程与教学的范围以满足考试的规范,但大规模的、多重选择的考试难以考核到要求创新思维、毅力和有效合作的重要课程目标,这些重要的技能要通过表现为本的评估方法(如档案、计算机模拟、口头表达、项目等)来评估,这些评估方法对学业基础、团队合作和问题解决技能的要求比传统的纸笔评估更高。表现为本的评估方法也考虑到了标准、教学活动与评估之间更强的和更直接的联系。尽管表现为本的评估有明显的长处,但极大多数全州性的评估系统依然还是多重选择题或者多重选择题辅之以少量开放题。对高费用、可能有争议的内容、技术上的适当性以及冗长的管理程序的关注,致使许多州避免把表现为本的评估纳入到全州性的评估之中。相反,各州把表现为本的评估的开发和实施的权力下放到地方学区或学校。这样做的危险性是地方学校和教师可能忘记这些更“可信的”评估手段,因为全州性统一考试愈加普遍,愈加要求教师投入时间和精力。克服这一不足的可行办法是:制定政策鼓励地方学区、学校和教师把课程的范围扩充出全州性统一考试覆盖的技能之外、采用表现为本的评估来强化重要的课程目标。 

  (3)统一考试会导致对学生成绩不恰当的推论。一些评估系统试图用同样的考试来达到多种目的和得出多种推论,这种做法是有问题的。例如,许多考试的目的是评估学生的内容知识或评估学生在特定时间相对于常模组的成绩(如斯坦佛成绩测试9)。但是,一些州也在使用这些考试来帮助确定学校和教师是否应当得到奖惩,而考试本身并没有这样的目的。同样,一些州用同样的考试作为中学毕业考和进入州大学的升学考,而这两种考试的目的要求有不同的编制策略和确认策略。克服这一不足的办法是:把评估手段的使用限于原定的目的或者采取措施验证某评估手段任何新用途的适当性。 

  (4)统一考试会加重教师和学生的负担。全州性的统一考试往往成为一个已经有其他考试在内的评估系统的一部分。各州必须避免在各个年级增加更多的考试。除非考试的数量和考试的频次是有限制的,否则,各州就有可能创造一个严重加重教师和学生负担的评估系统,从而占去宝贵的教学时间和资源。对教师专业发展注意的不够往往也加剧了统一考试的负担。尽管教师在使任何评估制度取得成功中起着不可或缺的作用,但他们通常缺乏对这种考试的目的、内容和实施计划的基本性的了解。更值得引起警觉的是,教师往往缺乏教授学生挑战性内容所必需的教学技能、教学策略和设施。克服这一不足的办法是:决定哪些考试是真正必需的,全州性的考试必须考虑到全面的测量和不牺牲教与学的时间,考试的负担和责任应当由一所学校的各个年级分担;其次要确保教师了解与实践评估所基于的标准、学习教学策略以帮助学生达到熟练水平,并以接受培训来帮助起初失败的学生;教师必须主动参与到评估系统的制定和实施之中,这样统一性的评估系统才会提高学生的成绩。 

  美国还加强了对教师工作的评价,评价分为五大方面:“创造学习环境”、“课堂管理”、“有效教学”、“监测和评估”以及“教师合作与专业发展”等五个大的方面,制定得较为详细。 

  (一)创造学习环境 

  1、老师对授课内容和授课对象都有深入了解。了解该门学科的组织结构、同其它学科的联系以及在实际生活中的应用; 

  2、有效地准备教案。设立学生学习目标时将学生看作投入、自信的学习者;把对学生的生活真正重要的主题作为备课的基础;每学期都有大纲、教学目标、学生产出期望和一个教学日历;备课目标同波士顿市学习标准相一致;将要讲授的课是能为学生提供思想碰撞、和教材融会贯通、师生和学生之间有互动效果的课;确立学生首要掌握的技能、概念和词汇量;对每一个单元的学习都采用参与式教学,包括技术的运用; 

  3、教学材料能帮助所有的学生掌握课程内容。收集丰富的教学资源,包括多媒体、图书馆资料和技术等;使材料同课程目标、学生需求以及学习方式相匹配; 

  4、老师创造一个有助于学习的课堂氛围。教室布置合理、有吸引力和安全感;教室布局时常有变化、突出课程主题和学生的学习成绩;充分体现多元文化和各民族传统。 

  (二)课堂管理 

  1、老师维护清楚的标准来判定良好行为、互相尊重和安全感。通过公平、礼貌和关心来赢得尊重和建立融洽的师生关系; 

  2、为学生学习和参与创造一个积极的环境; 

  3、帮助学生树立信心、毅力和责任感; 

  4、老师在教学压力下保持从容有效的教学方式。 

  (三)有效教学 

  1、老师与学生交流学习目标、标准和对学生的期望; 

  2、老师实施适当教学技巧激发学生的动力并使之参与; 

  3、培养学生独立精神和它们的高级思维技能; 

  4、提供足够的时间和帮助使学生掌握教学内容。 

  (四)监测、评估和后续活动 

  1、老师自始至终监测学生的学习; 

  2、对学生学习进行公平有效的评估; 

  3、利用课堂上采集的数据,调整并提高教学; 

  4、对没有达标的同学进行课外辅导。 

  (五)教师合作与专业发展 

  1、与家长的合作:告知家长对学生的期望和学生的表现;多与家长进行接触,使他们参与到对孩子培养中去;寻求其他途径,使家长能为班级和学校做贡献。 

  2、与同事的合作:教师是整个教职员工集体的一分子;为实现整个年级/团队/部门/学校/波士顿市的目标而共同工作;带着积极向上、兢兢业业、光明磊落的态度完成工作。 

  3、校内职责:老师通过准时、全勤为学生树立榜样;本着职业精神履行日常职责;不论是课堂教学还是课外活动,老师都应面向全体学生;配合学校实施综合规划。 

  4、专业发展:教师尝试创新课堂教学策略并检验其效用;对课程内容及时更新;教师不断学习和反思。 

  美国教育重视评估手段及其有效性,基于网络的实时在线评估与测试是美国中小学教育评估的一大趋势,但是如何测量一些量化的东西(尤其是学生的情感、意志、思维等)仍然是没有定论的。这种评价手段在自然科学上用得比较多,而在社会科学、人文科学等方面运用得比较少。 

  二.英国的中学历史教学评价状况 

  英国的历史教学实行的是structure of the Observed learning Outcome (SOLO)评价模式,这是为学校教师提供一种描述并评价学习者学习结果的系统方法,它是从学习结果的结构复杂的角度来对学习者进行分层评价。学习结构的复杂性主要包括两个方面:一是量的方面,即学习要点的数量;二是质的方面,即如何建构学习要点。根据这两方面的要求,学习结果分为SOLO的五个层次。 

  1、无建构层(prestructural)。指学生并没有真正理解学习内容,他们用一种不负责任的态度来应付任务,或他们被材料中的无关内容误导,因此在他们的学习结果中未获得任何学习要点。 

  2、单一因素建构层次(unistructural)。指学生的学习结果中涉及了构成问题之众多要点的中的一个。 

  3、多因素构层次(mutistructural)指学习结果中涉及了构成问题的若干要点,但学生只是简单罗列这些要点,而这些要点似乎是相互独立、并无关联的。 

  4、关系建构层次(relational)。指学生的学习结果中涉及构成问题的若干要点,并且能够把这些要点组织成一个连贯一致的整体。这一层次表明学生真正理解了问题。 

  5、抽象建构层次(extended abstract)。指在关系建构层次的基础上抽象化、概念化,产生一个新课题。这一层次只有那些达到一定年龄阶段并具有一定抽象思维能力的学生才能达到。它是教学目标预料之外的。 

  根据这五个层次,可以建五个等级 

  F等:这一类指学习认知方面的不及格,也包括道德方面的不及格,如抄袭。(相当于SOLO中的无建构层次) 

  D等:这一类指学生已理解了所学知识的一方面或一些基本的东西。(相当于SOLO中的单一因素建构层次)也包括对原材料几乎不加改变的复述。(也是SOLO中的单一因素建构层次,因为只用了一种学习策略) 

  C等:这一类表明学生已经理解了所学知识,也能涉及问题的几个方面,但学生没有把这几方面综合起来,只是简单罗列(除非题目要求就是列举)。这类答案的学生相对来说引用了较少的原材料,通常是原材料的一些段落。他们所做的工作就如一种典型的图书馆整理工作,既全面又好,但只是原封不动地吸收知识而不是综合知识,因为几乎没概念化。这类答案的实质是“知识倾倒”:“我将把我所知道的一切都写(说)出来,当然我不应该不及格,幸运的话,我知识的广度还能让人刮目相看呢。”巨大的知识覆盖面是无可挑剔的,但它毕竟不能打通代替综合。总之,C等的答案就象一份清单,一张事件的年代顺序表,一篇解说词,不管题目要求需要复杂的建构,原因解释,比较,对比等。但好象这种知识倾倒却很受有些评分者的欢迎。(相当SOLO的多因素建构层次) 

  B等:这一类指学生把部分紧密结合成一个统一整体。B等要求学生回答问题能覆盖原材料,区分重点非重点,提出观点,有选择地引用材料论证观点,并用逻辑严谨的语言表达。(相当于SOLO的关系建构层次) 

  A等:这一类是只可辩认,不可具体说明的,即无法事先确定,但一旦出现,你就会知道。A等的答案反映出高水平的抽象思维,如学生运用现有的概念解释新现象,又如学生通过思考,或通过个人经历,或通过敏锐的观察力,从原材料中概括出一个新问题,或得出一个具有创造性的结论,又如学生能正确引用参考资料来论证自己的观点。(相当于SOLO的抽象建构层次) 

  以下试题充分体现了,SOLO分类系统评价模式: 

  阅读以下有关第一次世界大战后调停的摘录,然后回答随后的各个问题。 

  首相曾去凡尔赛向德国人提出和平条款,他回来时感到疲劳和愤怒。德国人非常傲慢和粗暴。劳合·乔治说,他第一次像法国人那样地感到德国人是那么令人憎恨。(摘自劳合·乔治的秘书费朗西丝·史蒂芬逊的日记) 

  问题1、a:出席凡尔赛会谈的法国领导人是谁?(1分) 

  b:为什么法国人比英国人更憎恨德国人?(3分) 

  2、试解释当时德国人为什么非常傲慢和粗暴。(6分) 

  3、凡尔赛会谈上的和平创造者是否对德国人太仇恨了,以致于未能促成公正而明智的和平?仔细解释你的回答。(15分) 

  评分规则 

  问题1.a(1分) 

  目标:回忆 

  答案:克里孟梭 

  问题1、b(3分) 

  [注]简单的回答是因为1914年至1918年间战争造成的破坏和带来的痛苦,而这样的回答只能评1分。显然,对这个问题有更多的内容可答,答题人表明他理解有一种传统仇恨,而且与英国人的观点进行比较,则可评2级水平。这一问题问的是为什么法国人比英国人更憎恨,答题含有一些对比说明,则评3分。 

  目标:因果说明 

  水平1 简单谈到1914年或1870年的战争损失或侵略。(1分) 

  水平2 阐发1914年至1918年间战争破坏或损失的主题思想,同时也说明法国与德之间的传统仇恨。 

  如能考虑和说明为什么英国人憎恨较少,而不仅是回答法国人恨得更多。一般应评3分。 (2—3分) 

  问题2(6分) 

  [注]这里有一个很大的诱惑,就是把以上的问题理解为“为什么德国人不喜欢凡尔赛条约的条款”的问题。虽然条约的各项条款必定具有很多重要性,但答题人必须设法找出摘录中所述德国人那种态度的原因。对这些苟刻条件的明显反应更大的可能是愤怒、痛苦和沮丧,而不是傲慢和粗暴。较好的答题人会看到这个试题不只是关于德国人接受和平条件本身,而是关系到德国人在战前和战争期间的强权与骄傲,以及他们关于怎样拟订和平条款的期望。 

  目标:因果说明 

  水平1 过分简单的见解,例如,凡尔赛条约是单方面对德国人的苛刻条约或“德国人不认为自己战败了”。 (1分) 

  水平2 指出单一的原因,例如,条约的一些条款,或者指出表面的多种原因,含糊不清或部分准确。列出条约的一些局部条款,几乎没有解释。 (2-4分) 

  水平3 指出多种原因,认识到德国人对法国人和英国人的态度的深刻原因,同时论述直接原因。 (5-6) 

  问题3(15分) 

  [注]很多答题人仅仅根据条约的条款对德国人是否“公正和明智”来论述这个问题。显然,很多人对描写有关条约的缺点,或法国和不列颠领导人的态度准备有素,立即下笔,因而很多答题人只能达到3级水平的回答。如果他们一开始便将这些因素写出来,则可上升到4或5级水平。欲得到高的分数,重要的是将和约条款、动机和观点联系在一起。 

  目标:根据当年的时代背景,理解动机 

  水平1 答题内容过分简单,缺乏证据或论证。 (1-2分) 

  水平2 答题内容只有单一的原因解释,或者一般评述凡尔赛和约条款。 

  考虑到同盟国的动机或对德国人的仇恨,而未参照具体的和约条款加以说明。 (3-5) 

  水平3 答题内容有多方面的原因解释——也许有些肤浅、含糊或不够准确。能够将凡尔赛和约的特点与“对德国人的仇恨”和“公正和明智”联系起来。 

  只要答到法国竭力惩处。 (6-9) 

  水平4 答题内容详细解释各同盟国领导人的态度与凡尔赛和约条款的联系,并且对这些条款是否“公正和明智”加以评论。 (10-12分) 

  水平5 答题内容表明很好地理解本题的要求,能够整体考虑到凡尔赛和约,或许也能逐条加以考虑。评价各同盟国的动机以及情感,并在此基础上评估解决办法。可以对“充满仇恨”质疑。 (13-15分) 

  以上是英国剑桥大学地方考试委员会中学历史学科考试(GCSE)结构式试题。 

  所谓结构式试题,系指在同一试题的一则或一组材料(情景)下,围绕同一主题设计了一系列有关的或引申的从易到难、由简至繁之问题的试题。这种试题的功能通常是考查一组不同类别和层次的成就目标的,可以是对历史事实的回忆,也可以是理解历史事实与解释的能力和从历史材料中获取证据与判断历史材料的可靠性、有用性的能力。一般地说,以考查各种能力目标为主。(有关目标问题可参见《历史教学问题》1992年第1、2、3期,笔者所译英国伦敦大学地方考试委员会《历史学科1-4学习阶段成就目标和学习大纲》)为了确保试题能有效地考查到预先设计的目标,命题者在材料的性质、形式、角度、外显性,问题的提法和评分规则等方面采取了相应的技术措施,有着独到的构思。 

  结构式试题的设计主要同在英国史学界和教育界流行的下列观点有关: 

  第一、史学研究的对象是过去的事情,属于人文科学。除了对史实的确认有着相当的受史料限制的困难和相对性外,对史实分析及看法则有更大的受人们现实处境与经验影响的差异和或然性。因此,从本质上看,史学的发展是以史料的发现、考证和人们的历史意识、思维方式的进步为标志的。 

  第二、教育的目的是儿童的发展。从长远的观点看,前人的研究经验和成果是儿童发展的一种手段,儿童应该藉此去学会独立地探索、思考问题的习惯,培养(而不是记住)历史意识和思维方式。从而,在今后的道路上能够利用和扬弃前人的成果,正确地处理历史和现实问题。因此,在学习中,儿童从模仿到形成自己的思考和处理问题的能力,要比仅仅是记住史实和成年的推理过程与结论更为重要。 

  第三、考试本身是教育过程中的一个环节,即使从其相对独立的意义上看,它也是教育的“仆人”。它一方面应该尽可能地符合教育的目的、性质、任务和方式,使其更富有教育意义;另一方面应该有利于鉴别和诊断学生的发展水平,既要了解学生“掌握了什么”,更要了解学生“还会什么”。因此,考试应当是让学生有所发挥、发展的机会,而不是对学生的一种限制。至少,在认识上应当是这样的。 

  第四、GCSE的性质是水平参照考试。除了在同一学科的同一次考试中应当为不同水平的学生设计不同的试卷,以及同一份试卷中的各个试题应当按概定的成就目标设计一定的“阶梯”外,试题本身也应当是一种“阶梯”,使不同水平的学生在该试题上都能有所表现。所以,必须设计一种“跳远”式试题,跳多少算多少,而不是“跳高”式试题,跳不过就失败。 

  三.俄罗斯教育家在教学评价问题上的观点 

  前苏联教育家苏霍姆林斯基在给教师的一百条建议中曾说到评分应当是有份量的,不应当把知识的评定作为某种孤立的东西,当教育和学生之间的关系建立在互相信任和情有好意的基础上时,评分才能成为促使学生进行积极的脑力劳动的刺激物。可以说,评分是教育上最精细的工具之一。根据学生对教师所给的评分所抱的态度,我们就可以准确无误地作出结论,断定学生对教师的态度如何,是否相信和尊重教师。我想就知识评定的问题给教师提几点建议。 

  第一,评分宁可少一些,但是每一个评分都要有份量、有意义。在我漫长一节课上的回答给学生打分数。我给的评分总要包括学生在某一时期内的劳动,并且包含着对好几种劳动的评定——包括学生的回答(也可能是好几次回答)、对同学的回答的补充、书面作业(不太长的作业)、课外阅读以及实际作业等。我用一段时间来研究学生的知识,学生也感到了这一点。到了一定的时间,我就对他说:“现在我要给你评分了。”于是又开始了研究他的知识的下一个阶段。这样学生也很明白:他的任何情况都逃不出我的注意。 

  第二,如果学生由于这样或那样的原因和情况而没有能力掌握知识,我是从来不打不及格分数的。如果学生感到没有努力的方向,学生自己什么也不行,这对他们的精神是最大的压抑。心情苦闷和精神抑郁,这种情绪会对学生的全部脑力劳动打下烙印,使他的大脑好像变得麻木起来。只有那种明朗的、乐观的心情才是涨养着思想的大河的生机蓬勃的溪流。如果学生愿意学习而不会学习,就应当帮助他,哪怕前进很小的一步,而这一步将会成为他的思维的情绪刺激的源泉。 

  第三,如果你看出学生的知识还比较模糊,在他们关于所学的事物和现象的表象中还有些不明确的地方,那你就根本不要给予任何评分。如果这个学生的眼光表明他还没有做好回答问题的准备,那么我就不评定他的知识——应当首先设法让学生学会知识。 

  第四,应当避免提这样的问题,这些问题要求学生准确无误地重复教师所讲的东西或者从书本里背诵的东西。在教育过程中有一样非常有趣的东西——我想把它称之为“知识的转化现象”这里指的是思维逐步地深入到知识中去的情况,即当学生每一次回头来看已经学过的东西时,都能在各种事实、现象、规律性中看到某种新的东西,研究和分析这些事实、现象、规律性的某新的方面和新的属性的主要特点。应当把知识转化作为复习的基础。 

  苏霍姆林斯基有关教学评价问题的观点,在俄罗斯是很有代表性的。 

  四.澳大利亚教学评价的状况 

  为了检验和促进学生达到教学目标,澳大利亚教育界十分重视建立相应的考评体系。“教育评价”是师范教育的必修课程,教育部门颁布了专门的教育评价指导手册,用以指导教师的考评实践。中学历史教学也遵循这一评价原则。以新南威尔士州颁布的《小学生考评指导手册》,可以看出澳大利亚中小学生考评系统主要包括考评的指导原则及考评方式等内容。 

  (一)考评原则 

  小学教师选择考评方法时应遵循以下原则: 

  1、紧密联系教育教学目标 

  教师在教学中运用的考评方法应该紧密联系教育教学目标,反映教学大纲的要求。教育目标和教学大纲分阶段的要求是描述和考评学生成就的标准 

  2、紧密联系教育教学过程 

  考评方法的选择应该与教育教学紧密相关。考评应反映学生进步和成就,考评应为进一步教育教学提供信息,应能诊断学生学习领域的优势和发展的需要。 

  3、方法应灵活、多样 

  教师应采用多种评价方式,给学生选择的机会,让他们在不同的背景下充分展示自己已经拥的知识、技能、态度和习惯。 

  4、确保考评的效度 

  考评应该准确而合适地测定教育教学目标和教学大纲明确定义的知识、技能、态度和习惯。如果不达到这一要求,考评往往会误导学生。当教学大纲列有态度和价值方面的内容时,这些内容应该作为学生的一部分被考评。 

  5、确保考评的公正性 

  考评应不受学生年龄、性别、生理或文化、背景语言、社会经济地位或居住区域的影响,应给学生的成功提供相同的机会和衡量标准。 

  6、促进学生的学习 

  考评实践应以学生为中心,应加强教师和学生之间及学生与学生之间的协作。应该让学生了解教育教学目标和教学大纲的要求及考评过程。学生应该参与评价过程,协商学习任务,积极调控自己的学习活动,并选择能反映自己成就和进步的评价方式。 

  7、促进教师的判断和决策 

  考评实践涉及教师在权衡和考虑学生考评表现的基础上,对学生学习的进步作出判断和决策。当学生在不同时间、不同场合成功地、稳定地表现出某种成就时,教师便可以作出有把握的判断。教师的判断和决策的可信性可以通过师生共同协商和理解学习结果、学习任务和内容,讨论学生在校内外学习和成就的样本而提高。教师的判断和决策应建立在明确的标准之上。 

  8、及时提供反馈 

  考评实践就该注意时效性,应给教师的教学和学生的学习提供及时的建设性的反馈,对学生进一步的学习提供指导。教师应该仔细安排考评的时间可控性及最大的运用价值。 

  9、尊重学生 

  考评应注意学生的个性差异,应意识到每一个学生都是一个特殊的个体。所有学生都应得到合适的机会来展露他们的才华和成就,考评应保护学生的自尊心和他们的一般利益,给他们提供诚实的建设性的反馈。价值和态度是学习的重要组成部分,他们与知识、技能具有明显的差异,应该在考评中受到重视。 

  10、学校内各方面协调一致 

  考评应通过计划和协作来调动整个学校的力量,关于考评的决策应充分考虑教材、班级、时间安排、教学方案和资源分配。 

  11、校内外各方面的协调 

  学校应与服务的社区根据当地的需要和期待在充分依据以上原则的基础上决定考评政策。学校应确保家长参与考评,让家长在考评过程中对考评政策的形成和检查发表意见。 

  12、充分发挥考评的作用能满足于不同的目的,服务于不同的对象。学生、家长、教师、其它学校及就业机构都是考评报告的潜在服务对象。学校可以在不同层次上使用学生的考评结果,包括个人、班级、年级及学校。这些信息可以帮助学生明确教育教学目标,帮助学校改进课程和教学。考评报告应明确其目标和服务对象。成功的考评应考虑学校服务社区的期待和整个教育系统的需求,特别是要让家长了解考评依据的教育教学目标及教学大纲的要求。对学生的成就与进步的报告可以通过依据教育教学目标及教学大纲的要求而定,也可以依据比较他们过去和现在的学习情况而定。学校和家长可以通过协商来寻找适合学生及最有效的方法。 

  (二)考评方法 

  根据以上原则,澳大利亚新南威尔士州小学界普遍采用以下方法对学习进行考评。 

  1、观察法 

  在教育教学过程中,观察法是一种常用的考评方法。教学大纲的许多要求,如学生使用仪器的技能及在小组中成功地活动的技能都有赖于教师的观察来考评。教师和学生都可以利用观察表格来记录整个学习过程中学生特别的技能、行为和进步,应该和教育教学目标及大纲要求紧密相联,应该具有可观察性。常用的观察表格包括学生个体使用的自我检查表和整个班级使用的记录表。 

  根据观察所采用的技术方法,可将观察分为一般观察和集中观察两类:(1)一般观察:这种观察将学生的成就和进步记录在包括整个班级成员名单的表格上。表格可以与学生档案放在一起,也可以挂在教室的墙上,让学生了解自己的进步和需要考评的内容。当一周结束后,可将观察表格裁剪下来,归入学生个人档案。最便利的方法是运用粘贴纸记录观察结果,一段时期后将其粘贴于学生的个人档案。(2)集中观察:这种观察集中于学生行为和结果的一些特别方面或集中于一组特别的学生,观察时让学生分组讨论一个数字问题的解答,在活动中观察学生的数学技能、说话和倾听表现的交流沟通技能。教师也可以采取在一定时是内集中系统地观察五到六个学生组成的小组,还可以通过向学生提问来获取更多的信息,据此了解学生是否掌握概念。 

  2、个人代表作品档案法 

  这是一种在澳大利亚中小学广泛推行的考评方法。这一方法始于艺术院校考生的选拔,学生在报名时递交部分个人作品作为个人能力和成就的代表,专家据此对学生进行考评和资格认定。小学生的个人作品档案并不仅仅收集学生经过选择的各科作品,也可以收集一切和学生学习有关并能反映学生成就的材料。 

  个人作品档案给判定学习在一定背景下的成就提供了依据。通过记录学生的过程及结果,档案给教师、学生和家长提供了有关学生学习的详情。教师可用此法进行形成性及终结性的评价。此法能积极促进学生参与学习,对自己的学习负责。 

  个人代表作品档案具有广泛的考评目的。不同形式的档案适合于不同教学、学习、考评目的。为了使档案能成为教育实践密不可分的一部分,教师应该认真细致地思考和计划建档问题,根据情况从以下三类人个人代表作品档案中选择适当的形式。 

  (1)形成性个人代表作品档案 

  这类档案的目的在于帮助学生评价他们自己的学习,了解自己的学习方式。该档案以学生的发展为核心,以形成性和诊断性的评价为目的,许多材料可以收集到这种档案中。例如学生英语学习的个人代表作品档案可以包括学生写作的草稿,修改后的文章,班会的记录,平时作业和考试卷。 

  师生在建立此类档案时应确定起止时期,一般按一个单元课程或一个学习主题收集材料。档案可以保留在学生作业本里,也可以保留在相应的文件和档案袋内。师生可以协商来确定档案内容,并让学生自己管理档案。 

  (2)综合性的个人代表作品档案 

  建立此类档案的目的在于帮助学生讨论他们的学习问题,为形成和解释学校报告及教师、学生、家长三方座谈提供基础。其目的既是形成性的评价又是总结性的评价。 

  此类档案既包括经过选择的学生学习过程中的作品又包括完成学习后的作品。通常每件作品都应有教师的评语。 

  建立这类档案有固定的时限,一般为一个学期。收集可以采用工作记录本、文件、档案袋等形式。师生通过协商确定档案。 

  (3)三方协商考评法 

  教师、学生、家长三方协商考评法包括三方座谈及三方评价。三方座谈也被人称为由学生负责的会议或以学生为中心的会议。 

  这种考评方法给教师、家长和学生提供了一个了解学生学习进步和成就的论坛。这种评价涉及学生汇报自己的成就,家长对此作出评价,学生的汇报应以自己的学习作品、考评标准及教育教学目标与教学大纲要求为基准,并提供自己的个人代表作品档案。这种方法有利于调动学生、家长的积极性,让家长了解教育教学目标及教学大纲的要求并熟悉整个教学过程,建立三方良好的协作关系。 

  4、活动评价法 

  学生的活动包括学生的日常学习的各个方面。例如计划、辩论、作业、演讲、实验和体育活动。在活动中,学生运用与学习活动紧密相关的技能。活动评价一般采用经过认真研究的活动评价标准进行判断。 

  衡量学生的技能,例如英语程中的会话技能,个人发展、健康及体育课程中的运动技能,科学和技术课程中的实验技能,创造和实践艺术中的创造能力的考评都应通过活动来进行。 

  自我评价及同伴评价常和活动评价法一起运用,用来考评学生的技能和能力。 

  5、学生自我评价法 

  澳大利亚教育十分重视小学生的自我评价,并把它看是学习过程中的一个有机组成部分。小学生通过在教师指导下,采用一系列检查表进行自我评价。这可以加深学生对自己作为学习者的理解。自评有助于对学习目标的认识,对学习过程的控制,培养和形成对学习及活动的评价能力。 

  6、考试法 

  考试包括口试和笔试。在新南威尔士州除了任课教师命题的考试外,在小学三年级和五年级还有州教育部门组织的语言技能和数学技能考试。所有考试都强调结合教学,给学生、教师、家长提供及时的反馈。 

  为了促进教师提高命题水平,教育部门提出了命题的的十项建议;(1)准备一份考试内容指南表,内容包括考评的具体目标和结果,将其作为选择题型及命题的指针;(2)应该准备超过所需要项目的试题,以便于进一步的修改;(3)在考试前一段时间完成试题的编写。将试题放几天后再重新检查,以改进原来命题中的缺陷;(4)使编写的试题包括指南中的全部内容与设计的目标一致;(5)编写试题的用语应明确,应认真细致地思考提问的方式和结构,范例和明了的语言,运用正确的标点及语法,避免不必要的词语;(6)试题应适合学生的阅读水平,用词越简单越好(7)学生的反映应针对需要考评的内容,不受其他无关因素的干扰;(8)不应使一些试题为其他试题提供答题暗示;(9)阅卷教师应在试题的答案上获得共识,(10)在检查试卷时,应考虑其与教学目标的稳定相关性,内容的合适性、清晰性、难度、无答题暗示和偏差,尽量使修改后的试题与命题指南的要求一致。 

  7、学期及学年报告法。新南威尔士州教育部门要求学校的报告应明确包括以下内容:第一,学生已经掌握的知识;第二,学生能够运用的技能;第三,已经养成的态度和习惯。学生的成就应建立在与教育教学目标及教学大纲要求的标准上,而不是建立在同班、同年级同学比较的基础上。 

  报告应使家长了解子女的学习进步和教育教学要求。报告至少每学年两次。报告可以和学生个人代表作品档案及其他材料装订在一起。报告应包括知识、技能、态度和习惯方面的综合内容。报告应指出学生学习所处的程度,包括三个层次:第一,正处在形成和发展的层次中;第二,已经达到和实现的层次中;第三,仍处在某种层次之下,有待于进一步努力。 

  以上虽然不是完全针对中学历史教学,但对我们建立中学历史教学评价体系的探索极有启发。 

  五.国外教学评价方法对我们的几点启示 

  上述各国的教学评价体系都是在吸收现代教育学新成果的基础上,根据本国的具体情况而建立的,由于国情不同,我们不能也不应完全照搬,但这些各有特点的评价方法确实有不少长处可供我们借鉴,大体而言,以下几点对我们是深有启发的。 

  1、明确而具体的教育目标是进行教育评价的基础。以美国为例,制订《标准》的决策者真正关心的问题不是美国中小学在学校应该学习什么样的历史,而是学生将具备什么样的历史观,他们将如何运用这种历史观去评价美国的过去、认识美国的现在和预测美国的未来,他们深知美国社会正在变得更加多元,希望美国的教育能提前为一个真正多元化美国的到来做好准备,他们同意一位英国政治小说家对历史学的命运和功能的观察,“掌握过去的人掌握着未来;掌握现在的人掌握着过去”。 

  据此美国《全国历史教学标准》在教学目标上明确提出培训学生的五个方面的能力(1)对历史发展阶段和历史分期的熟练掌握;(2)对历史材料的理解能力;(3)分析和解释的历史的能力(4)历史研究的能力;(5)历史问题和历史分析的能力。 

  有了明确而具体的教学目标评价时就有了依据。 

  2、评价手段多样化 

  (1)考试依然是评价历史教学的重要手段,在目前教学体制下,考试有它存在的必然性和必要性,教育方式能展现课程内在的教育理念。考试是检测教育质量、评估教师学术水平和检查学生掌握所学知识以及学历水平的重要手段,是教育信息反馈的重要渠道,是教育教学过程中不可缺少的重要环节。考试还能产生“回流冲击”(backwash)。所谓“回流冲击”指考试不仅影响课程,而且还影响教师的教学方法和学生的学习方法,简单地说就是评价决定课程。 

  比如,一些教师常常说:“考试考什么,我就教什么;考试怎么考,我就怎么教。” 

  又如,如果学生知道将要进行考试来评定学习成绩,他们会把考试的一系列目标当作学习内容。“回流冲击”的影响有时是正面的有利的,有时是负面的不利的。 

  (2)要突破以书面考试作为唯一评价结果的简单终结式评价解释模式,而应研究如何对多种评价结果进行整合性分析与合理的解释。从而了解学生学习历史的各方面发展水平,发展潜能以及发展中存在的问题。 

  传统上,历史考试所测验的主要是能够背出一些资料的能力。如果历史教学的目的是使学生记得一些特定事实,那么这样的评价是合理而恰当的。但英国历史教育家强调“历史是一种研究的方法而不只是一种知识载体”,学生学习历史还包括学习这一种知识的结构,那么用来确定学生是否达到教学目标的评价当然不能只是着重于学生记得了多少事实知识。评价必须设法使学生表现他们对于历史要领和技能的掌握,并考验出他们一些较高层次的认知能力,如理解、分析、综合等等。那么在实际上要如何去设计评价方式才能达到这样的理想呢?英国历史教育者的做法之一是将平常作业的成果引入考试的总分之中,而且所占分数比例高在40%。这并不是为了酬报那些认真于完成作业的学生,也不是为了补偿那些考试临场表现失常的学生,而是因为这种方式更能评价学生的学习情况。(附英国GCE/CSE的评分作业) 

 

  3、加强对教师教学工作的评价。历史教学的评价工作本来就包括教和学两方面,目前我们所重视的是学生学业评价的研究和实施,但对教师教学工作评价的研究相对比较薄弱。在某种程度上,教师的教学工作决定了教学是否成功。因此对教师的评价工作要进行研究,制订出具有可操作性的具体评价标准。 

  4、评价手段的现代化 

  随着科学技术的发展,教育测量的评价手段,也越来越现代化,美国基于网络的实时在线评估与测试已是一大趋势,相信这也是我国历史教学评价的发展方向。所要解决的问题是如何使“无情”的电脑评价变得“有情有义”。

    相关链接 - 中华人民共和国国史网 - 中国社会科学院网 - 当代中国研究所 - 人民网 - 新华网 - 全国人大网 - 中国政府网 - 全国政协网 - 中国网  - 中国军网 - 中央文献研究室
    关于我们 - 联系我们 - 版权声明
    当代中国研究所 版权所有 备案序号:京ICP备06035331号
    地址:北京西城区地安门西大街旌勇里8号
    邮编:100009 电话:66572305 66572306 Email:gsw@iccs.cn