我们需要什么样的人才：从高考到申请制

引入

人的一生有无数次考试，特别是初等教育阶段。我们不妨思考：考试的本质到底是什么？个人认为，考试的根本目的在于筛选，是一个将不同考生分成不同聚类的分类器，通常是按某一标准来衡量人的“优”与“劣”的。为了方便，我们理想化地将被分类器划定为“优”的人与“人才”画上等号。因此，各种考试细节也被众人广泛研究，塑造着各位考生，使得他们尽可能的向能获得高分的方向发展。
考试制度纷繁复杂，大到国家，小到一个学生社团，都有专属的考试方式。中国的高考往往牵动着所有人的心。对于中国的家庭来说，一切事情都可能会向高考让步。高考往往发生在每一个孩子的十八岁那年，这意味着这是孩子的一次“成年考”；同时，高考是初等教育与高等教育的分水岭，是对十二年初等教育的一次简短而隆重的总结，大学是大部分孩子第一次远离寓居多年的家乡而独自生活的地方。另外的，当前“第一学历”歧视仍然屡见不鲜，好的高考成绩甚至能使人在找工作时得到红利，而坏的成绩则会被认为是一个人生污点，每每被提及只能面红耳赤、无地自容。
根据黄文权（2004）的说法，美国学生一年可以参加七次高考（i.e. SAT），甚至可以从初中开始考，考到满意为止，考完后可以选取最满意的两次成绩提交给大学招办作为准入依据。这当然能为学生带去很多好处：更多的考试机会能更准确的体现出学生的平均水平，也能在很大程度上降低学生的考试压力，从而获得更准确的结果。自2014年起，浙江省开始筹办首考，即每名考生的七选三（从物理、化学、生物、政治、地理、历史、技术七门课程中选择三门作为选考科目，采取赋分制）和英语共四科可以在一月和六月参加两次考试，取两次成绩中的最高分为最终成绩（如未参加考试，则当次考试记零分）语文和数学只能在六月参加考试。这也就意味着除了减少学生成绩波动，增强成绩的可靠性外，学生还可在首考某些课程上得到满意成绩后将更多精力投入到剩下的课程中，从而获得更优的出口成绩。

当前的大学高等教育貌似也存在很大的问题。根据卢瑶等人（2023，绩点为王的思维代价：学习投入与本科生的学业表现和高阶思维能力）的报告，通过对不同学校不同GPA分数段的学生进行“全国本科生批判性思维能力测评”量表（无法根据引用找到对应量表）以衡量学生的批判性思维能力。研究表明，“学习投入带来的GPA高涨是以侵蚀批判性思维能力发展为代价的”。不过“批判性思维”究竟为何物？这是一张什么样的试卷（量表）？会不会导致学生对这张试卷产生应试效应？不知作者能否给出确切的回答。

成绩不是衡量学生的唯一标准

“我认为中、美教育最大的区别就是培养考生还是培养学生。”（黄文权，2004，中美教育比较，第二章）我认为黄对考生和学生的区分是切中了肯綮的。在他的语境下，“考生”是关心考试胜过关心知识的，过度的刷题导致对常见的题型烂熟于心，考试成绩是光彩耀人的，面对各种试卷，总能答的又快又好。黄认为，这是我们的学生并不能获得诺奖的原因，因为诺奖需要学生有面向未知的勇气，而不是对着现成的答案磨刀霍霍。从某种意义上说，这是一种考生对考试的过拟合，高的考试成绩并不能直接揭示学生就具有高的学术水平。
目前，中国高等教育广泛应用的绩点制度就是对解决这一过拟合现象的尝试。除了每一学期的期中期末考成绩外，学生的绩点还取决于日常课堂的签到与表现、平时的作业与小测等多方面的因素。
不过，我并不认为高考制度是我们拿不了诺奖的罪魁祸首。诺奖的获奖周期约为四十到六十年，那会甚至可能高考制度都还没有启用。近几年，高考制度在不断的改革升级，高等教育改革的呼声也日渐高涨。不妨让我们有一些耐心，等待更多的人才从高考制度中涌现出来。
当然，我也同意成绩不是衡量学生的唯一标准。更多元化的考察方式能获得更多获得考生的学习状态与品性，能更准确的辅助招办选取他们需要的人才。例如，在考察学生的高考成绩之外，再加入一些高考所不能获得的考核方式。全国广泛开展的强基计划，浙江的三位一体（广东的6-3-1）等，都在高考的基础上，额外增加一轮或多轮、笔试或面试的选拔机制，从而增强考试成绩的可靠性。

绩点制度也有很大的改进空间

尽管这一制度的初衷是尽可能增加评价体系的多元化，减少期中期末考试失误对总分造成的影响，但是也意味着学生日常的一举一动都会被记录在案。在日常作业和小测人均满分的前提下，意味着在作业和小测中任意的疏忽失误都可能导致最终等第的降档。
这一切的根源其实来自于曲线评分机制与不合理的评估计划（例如低到离谱的考试成绩方差和高到离谱的占比）。复旦大学教务处在2024年高考前夕发布了新版本科生成绩记载规定。主要修改了以下几点：一是规定了A+和A的占比不超过30%，但A-及以下的等第不设置人数上限；二是学生在本科期间最多可以将16学分的课程（每学期最多一门课）设置为PF制，也就是不计入绩点。这其实是对曲线评分机制的一次变革，意味着学生可以通过合理利用政策获得更高的绩点。

但是，曲线评分机制也是一种迫于无奈的妥协。对于一所学生出口主要依靠对外申请的大学来说，只有让GPA的区分度变得更大才可能让真正有能力值得倾注资源的人获得更高的GPA，这才是对学生真正的裨益。复旦大学此举将提高学生的整体绩点，可能会导致接收申请的学校对其分数与能力对应产生怀疑，因此此政策并不一定带来的全都是正面影响。不过，每所大学都有不同的情况，在此不做正确性的评判。

为了提升GPA与能力的对应情况，可以考虑改良曲线评分本身。曲线评分的最大受害者莫过于3.7至3.9分数段的学生。对于3.9以上的学生，他们往往在高中时就是学校里的佼佼者，维护一个高绩点对他们来说并不是难事；由于A-对应的绩点就是3.7，对于3.7至3.9分数段的学生，想要维护当前的分数段就必须保证每一门课都是A，否则就会导致总绩点下降。这势必会给这部分学生带去很高的不确定性与学习压力。因此，为了提升区分度，我认为可以降低档位之间的步长，让赋分变得更细致一些。例如，原本的A-（3.7）可以被分割成3.7、3.8、3.9三个分数段，这样能更细致的反映学生所处的位置，尽管可能争取不到4.0，也可以考虑争取3.9，而按照现有的方案，就会直接被赋上3.7了。

同时也可以考虑改善评估计划。 理论上来说，评估计划中的每一项都应当尽量平均，考察项应当尽可能的多元化。例如我这学期正在上的一门课有这样的计划：
签到和上课表现 5
当堂小测 25
作业项目1 10
项目2 10
项目3 12.5
项目4 12.5
期末考试 25
这样的计划不仅有占比45%作业的，还有颇有趣味性的口头抢答。评估更加多元化，学生也不会因为一次考试跌倒而成千古恨。
相对来说，其他科目就没有这么多元了。大部分的课程都是这样的：
作业 20
期中 30
期末 50
由于作业基本没有分选性，一次作业低分最后影响的可能只是零点几分；而期末考试一失误，可能丢掉的就是十多分，而折合到总分上则是非常可怕的数目。
另外的，大学的职业与升学规划部门也可以多多为学生提出客制化建议，尽量发掘学生擅长的和热爱的，推动学生多元化发展。当前的申请有很强的套路色彩，几乎每一位学生到出口时都会有一段科研经历、一段实习经历、几个课程项目经历。对于目标院校的招办来说，对这些经历早已麻木，最后能比拼学生的就只剩下GPA了。如果能跳出GPA诅咒，多多发掘可能让目标院校眼前一亮的特色——当然更重要的是学生兴趣驱动——才能让学生学的开心、GPA的竞争压力变小的同时还能让申请结果得体，目标院校也得到了自己想要的人才。

成绩就是衡量学生的唯一标准

高考制度的优势在于高效与公平

讨论一切制度都需要提及其背景因素。目前来看，与我们的高考制度相对应的是申请制。根据黄（2004）提供的美国高考的情况，申请制强调不以成绩为唯一标准，而需要加入面试等其他各方面的因素。但是，个人认为这样的制度会出现以下两个问题：
一是无法实现高效。考试可以同步进行，只需要保证题目没有泄露，在相同时间开启同一份试卷，哪怕考生在天涯海角，哪怕考生是千军万马，无非就是多印一些试卷罢了。而如果是面试，则需要考官一遍一遍地重复问题，一遍一遍听考生回答或许考官都能倒背如流的答案。这对与少数的考生回答有特色的试题或许是可行的（因此不少三位一体采用了面试方案），但作为面向数千万每年考生的高考来说，这显然是不能被接受的。
二是无法保证公平。面试总是希望能体现学生的闪光点，也支持学生有千奇百怪的回答。但正是因为回答的千奇百怪，使得不同的观点并不一定能被统一。或许相同的回答在不同的面试官面前就会得到迥异的分数。

考试既是检验，也是评价

黄提出：“在美国，考试是老师了解学生、发现学生，与学生交流的一种手段，所以不在乎你画什么，而且老师也参与。但是在中国，考试就是择优汰劣的最终极、最权威的教学行为。”（2004，中美教育比较——关于考试与考试制度，第三章）这一点我并不敢苟同。在中国，考试不仅是择优汰劣的手段，也可以是老师了解学生、发现学生的方式。对于最终会被计入人生档案的大考，这当然是一种终极而权威的评判，但对于日常的小考，自然应当被当做是与学生交流的手段。平常的考试同作业一起，都是用来暴露问题的。在知识层面上，会做就是会做，不会就是不会，每次把不会的都补充上了下次就会了。当然，平时的考试还会模拟一种大考的状态，包括时间的掌控和心理的调整。对老师来说，看到某道题学生错的多，就可能是上课没有讲清楚，或者大部分学生掌握的不是很好，那就在课堂上着重强调一下，这一样是对学生的关爱，并不见得就有多么明显的弱势。
另外，从考试产生的初衷来看，其本质就是衡量学生的水平的。根据侯玉文《考试制度的起源》（2013），“考”更侧重考核，“试”更侧重评价，“考试”合在一起后，其内涵逐渐演变为特指考查知识或技能的方法和制度等。这也就意味着，“考试”就是为了分选而设定的，而分选的指标就是成绩，参加考试的唯一目的就是为了得到更高的分数。黄提到的他儿子在数学竞赛上为了啃难题而放弃了简单题本身就是对考试的一种亵渎。简单题你看不上，又如何证明你是真的看不上还是做不出来呢？就像姓费的那小子在纸上写下的那句“我确信已发现了一种美妙的证法，可惜这里空白的地方太小，写不下”，但谁又能知道他是不是真的写不下呢？人是需要有个性的，但太有个性则变成了固执己见冥顽不化。从某种意义上说，考试也有淘汰这一部分人的功能，毕竟谁也不希望将来自己的合作伙伴是一个喜欢说“空间太小，我写不下”的人。

竞争并不是坏事

竞争是必然存在的，因为竞争是与能力匹配的资源再分配。如果消解了竞争，意味着教育资源与受教育人群的错位，这是一种资源的浪费。我们不应该反对竞争，竞争不会造成关系的紧张。竞争并不意味着恶性竞争。在当前高考人数体量下，能竞争取代掉你的人绝不只是与你朝夕相处的同学。与其阻碍他人进步，不如提升自己。事实上，我们见过大部分取得优异成绩的结伴者都说他们之间是“相互竞争、相互学习、相互帮助、相互促进”的关系。

与其抛弃考试，不如改良试卷

随着近几年高考改革深入，高考试卷（主要是全国卷）已经变得非常值得推敲了。不过，高考作为每年一次的全国关注的大考，其试卷是大量教育专家通过大量时间打磨出来的结果，并不是每一场考试都能做到的。试卷的整体设计应当遵循尽可能以考纲为准绳，以增加区分度为蒿矢，努力让每一个学生的成绩都能更准确的反映其知识水平和学习能力。
在试卷的整体布局上，应当要确保有简单、中等和困难三档题，每档题都应根据考试的对象设置合适的分值。应当在答案合理、符合正常人思维的前提下，尽可能使题目和答案客观、可量化，确保不同的改卷老师总是能给出相近的分数。例如，我最近参加的某门课程期末考试中，有72分（满分100）为基本题，还有大分值的题目可以在考场上通过验算检验，而剩下的题目都是难题，基本全靠运气和改卷人的仁慈，这也就意味着中位数会在72分附近徘徊。这对中位数附近的学生或许会有利，但对高分段的学生来说，想拿一个高分是何其困难。再加上一不小心在72分中随便错一些，那便是一学期的努力白费了。
在试题设计上（尤其是大学的期末考试），我有以下几点建议：

首先，考试应当明确设立考纲，需要每一名学生清楚考试的范围、题型和难度，要留给学生充分的准备资料（例如历年试卷，如果可以的话还应该提供考试的复习资料）。
其次，一切选拔制度的根本目的是选拔，而不是炫技或者是刻意为难考生。要尽量清晰地描述题意，并尽可能避免模糊表达。对因表述不清楚而导致大量学生丢分的情况，要积极承认并提出下一步的补救措施，可以接受的就接受，不能接受也要好好说话，而不是梗着脖子红着脸信口开河转移话题诬陷学生不来上课。
同时，题目需要有足够的铺垫和小问，尤其是对于一些区分学生层次的难题。出一道题可能需要好几天，做题者却只有不超过二十分钟，做题者并不一定能完全对上出题人的思路。或许完整的想出一道题的思路能体现一个学生具有非凡的水平，但并不意味着有了铺垫就没有分选性。相反，有铺垫的试题更像是在圈定的范围内跳舞，更有针对性的体现学生对知识点的掌握情况。例如：
2022年新高考II卷 22. 已知函数 $f(x)=xe^ax-e^x$
(1) 当 $a=0$ 时，讨论 $f(x)$ 的单调性
(2) 当 $x>0$ 时， $f(x)<-1$ ，求实数 $a$ 的取值范围
(3) 设 $n\in N^*$ ,证明

\frac{1}{\sqrt{1^2+1}}+\frac{1}{\sqrt{2^2+2}}+\frac{1}{\sqrt{3^2+3}}+⋯+\frac{1}{\sqrt{n^2+n}}>\ln ⁡(n+1)

多个知识点的综合应用也是考察的一个方向。例如：
2021年新高考II卷 21.一种微生物群体可以经过自身繁殖不断生存下来，设一个这种微生物为第0代，经过一次繁殖后为第1代，再经过一次繁殖后为第2代……，该微生物每代繁殖的个数是相互独立的且有相同的分布列，设X表示1个微生物个体繁殖下一代的个数， $P(X=i)=p_i (i=0,1,2,3)$ .
（1）已知 $p_0=0.4,p_1=0.3,p_2=0.2,p_3=0.1$ ，求 $E(X)$ ；
（2）设 $p$ 表示该种微生物经过多代繁殖后临近灭绝的概率， $p$ 是关于 $x$ 的方程： $p_0+p_1 x+p_2 x^2+p_3 x^3=x$ 的一个最小正实根，求证：当 $E(X)≤1$ 时， $p=1$ ，当 $E(X)>1$ 时， $p< 1$ ；
（3）根据你的理解说明（2）问结论的实际含义．
我们应当鼓励创新题。只要题目的铺垫足够，应当支持鼓励略微超纲的知识点被编为试题。学习是永无止境的，大学教育教的不只是知识，还有获取知识的能力。如果出题人能在试卷上将树剖基本思路讲清楚，这题目一定比所谓的“大根堆是不是小根堆”之类的文字游戏和脑筋急转弯有意思也有意义多了。

总结

本文浅薄地讨论了一些考试与人才选拔制度方面的话题。具体来说，本文讨论了高中到大学升学选拔过程中不同制度的优缺点。高考作为“一考定终生”的制度，其成绩确实会有一些波动，也并不一定能准确的提取考生的能力，也的确很可能导致考生过分专注试题的研究而忘记了学习本身的美好。但是，高考还肩负着将数千万考生划分入合适的大学的职能。就目前的情况看，高考仍然是中国教育分选器的最优选择，其高效率和公平性是任何其他方法所不能替代的。当然，高考也在不断的改革升级，我们欣喜地看到，越来越多人性化的、客制化的、创新型的制度和题型正在涌现，高考制度正不断向好的方向发展。相信高考制度会越来越好，为国家发展充当更强劲的引擎。
不过，对于高等教育，我们似乎更强调教授的科研能力，而忽视了其作为“教授”的“教授”功能。不过，让每一位教授都有教育经历并不是一件可行的事情，推动高等教育向更合理的方向发展，让硕博的选拔更科学还需要包括学生、教授以及行政人员的接续奋斗。
另注：由于本人并没有教育学经历，为一些个人看法，如有不当之处，还请斧正。

[1] 黄全愈.(2004).中美教育比较——关于考试与考试制度.中国教师(02),17-20.
[2] 侯玉文.(2013).考试制度的起源.甘肃教育(09),65.
[3] 卢瑶,沈红 & 张青根.(2023).绩点为王的思维代价：学习投入与本科生的学业表现和高阶思维能力.复旦教育论坛(04),78-86.doi:10.13397/j.cnki.fef.2023.04.016.

Linyong GAN