十八大以来,我们国家围绕着教育评价有好多的思考、政策出台,举措出台,只不过没有现在这么集中。
早在中长期规划里,就牵扯到了评价,如分类考试、综合评价、多元录取等说法。这个词一直到2014年高考改革方案里面还出现着。你再往前追,也有好多的。十多年前,甚至到2013年的时候,也提到学业水平综合评价。到2015年,职业教育也专门提到了评价。所以初中也好、高中也好、职业教育也好,都呼唤着评价,后来包括2017年的《关于深化教育体制机制改革的意见》文件里,也提出标准健全、目标分层、多级评价、多元参与等。但从长期的实践来,中国教育存在的主要问题是,教育评价的结果未得到有效运用,过程评价的诊断功能未能得到充分发挥,增值评价缺乏对评价对象主体地位的关注,综合评价的机制和标准还不够健全,良好的教育评价生态还未建立,第三方教育评价的作用未得到充分发挥,教育评价的理论、技术和专业人才仍较贫瘠。
五大改革,目标就是要破“五唯”。“五唯”不破,我们的人才培养和教育发展都会受到严重的制约。但“五唯”要打破,那你就得有新的东西来替代它,不要一说这个房子不好就要拆。今天这么冷没地方住,我们必须把新房子建好,把暖气装好,才从这个地方挪到那个地方,那个旧房子才能拆。所以我们的任务是要尽快建设新的评价体系,进行区域试验,重点检验,不断地迭代。直到有一天我们认为这个方案足以来替代原有方案,那么原有方案才终止。现在有些人有点极端,恨不得明天就取消高考,取消高考怎么弄?这么大的国家,老百姓这么关注升学,你在没有找到比高考更好的方式前必须继续坚持。没有一个人说房子不满意,今天晚上就弄个帐篷住在操场,没有人这么干,这个道理大家容易理解。
现在的职业教育,要高质量发展,讲双一流,怎么评?如果评不好,我们就由一个极端走上另一个极端,就会由这个问题变成那个问题,但是问题还是问题。
我们过程评价也没有得到充分地重视,因为对有些事情来讲过程更重要,比如德育这件事情就是不太好考。你要考的话肯定会出问题,一个人的道德品质靠考试来判断,那得满分的未必是道德完美的人,说不定未来还要出事呢。所以这件事情是靠不住的。靠什么?靠过程表现,这是比较靠得住的,过程评价要充分利用。
增值评价也要充分重视。人和人是有差距的。现在我们这种绝对评价,对有些孩子是不公平的。比如体育,如是正常人的时候,你可能会对体育评价不会有什么意见,但是人家如果天生是一个残疾呢?根本就不能跑步呢?人家还有残疾人运动会,还有可能为国拿金牌。但在你这里就可能考试不及格。为什么?我800米能跑吗?别说跑那么快时间,我一步也跑不了。这个评价应该是根据这个孩子的特殊情况,把他力所能及的事评出来,所以要强调增值评价。每个人坚持体育锻炼,体质不断增强,成绩不断提高,习惯有养成,这些东西是更重要的,而不是最终看谁跑得快。
我们必须系统化地建立良好的教育评价生态。我想强调一下第三方评估,就是将一些评价交给第三方,因为它比较权威,比较学术,大众也比较认可。因为你是办教育的,你来评你自己,这个结果基本上没评大家就知道了。
我在清华附中当校长之后,第一个关心的问题就是教育评价问题。所以在2009年后,就天天在想怎么样把考试评价给变成不是唯一的,打破唯分数论。那个时候我就研究学生综合素质评价系统。到现在研究了12年,系统也用了好几代了。我们以自下而上的方式,对学生各个方面进行观察、记录、分析,建立了包含9个模块46个维度的行为记录内容,构建了学生综合素质生成性评价模型。并利用大数据分析技术,开发学生综合素质生成性评价系统。目前已经辐射12个省7000多所学校数百万学生;此外我们还建立了教师专业发展与综评系统的建立。主要有个人成长记录、专业引领发展、特色成长助力、评价与规划四大模块。
我们的综合素质评价研究,其初的想法其实很简单,就是觉得有些教育评价,尤其素质是不可能考出来的,但那又需要评怎么办?就是过程评。我从过程里面的参与度、表现、收集大数据来评你。因为有了过程,结果就会水到渠成。天天锻炼身体好,认真学习成绩好,习惯好了结果自然就好,就这么一个简单的逻辑。但是过去没有信息技术,过程无法记录,数据无法收集,收集了以后无法评价。现在不一样,很简单就能把学生的整个发展过程,大数据全部收集起来,进行建模,进行大数据处理,进行评价生成,既可靠又好用,效率又高。
当然,我们要因地制宜,因校制宜,不同学校记录东西不同,不同年龄段记录东西不同。我们的团队一直在琢磨,如何评价?评价什么?我认为我们的攻关全部解决了这个问题,在北京已用了好多年,效果非常好。
诚信问题实际上在中国是第一大问题,我们也很好地解决了这个问题。用互相监督、公示等办法。就像发朋友圈一样,你做的事情在所有人目光下你就不敢胡作非为,以假乱真,而且如果一旦作假被发现,将会终身受到影响,在你的诚信体系里会被记上一笔。所以我们到目前为止还没人敢以身试法,因为会因小失大,失去诚信。
未来我们要首先解决学生评价问题。学生评价也分为学业评价、综合素质评价和高阶思维能力评价。
美国从2017年推出新的学生评价体系MTC里,许多都和思维有关。由此可看出,他们已经开始对学生创新能力和思维水平进行培养了,而我们还在知识的层面上打转转,这是非常危险的。如果我们能在教育评价上率先赶超欧美,就会在人才培养方面有赶超的机会。我们开端了一项事业,只要我们坚持,我想这个目标终究会实现。
在我们进行的几种评价里,要选出更适合评价内容的方式,要把它们匹配起来。有些评价可能要关注结果,有些可能既要关注结果又要关注过程,有些适合增值,还有些可能要综合,等等。我们还要想办法营造良好的评价生态环境,让大家重视评价、关注评价,同时能够包容评价这种实验。
我觉得要重视评价的理论工具和创新,人才培养现在特别需要。
另外我前面强调过的,要重视第三方评估。可鼓励大家成立一个第三方教育评价的研究院,他们可以接受委托,在全球范围里给你得出评价结果。他们会给你讲为什么这么评,他们有他们的公式,有他们的专家团队。有时候推荐制比申请制更重要,你看诺贝尔奖什么时候申请过?他其实是在全球找好几百个同行,每个人背对背给我提。你是数学家,你是有名数学家。你认为全球最牛的50个数学家是谁,将每个人最牛的成果写出来,这就是一种评的方式。