高校教师考核体系的难题与改革

邱运华邱运华，首都师范大学副校长，文化研究院常务副院长。

近年来，高校教师忙于填表申报项目而无暇教书读书、部分高校科研经费管理不善被挪用被置换、“青椒”（青年教师）压力过大等与高校教师考核体系有关的问题，引起了舆论的广泛关注和热烈讨论。这些舆论批评近年来也推动了高校教师考核体系的调整。我们有必要梳理当前高校教师考核体系的基本结构与逻辑，把握目前这一领域改革的基本态势，并在此基础上有所建议。

量化考核与学术追求的结合是生态问题

上述问题的产生，与中国高等教育所处地位有关。当代中国大学管理体制深受外国教育体系影响。影响源自两种参考体系，一是苏联模式，二是美国模式。中国教育体系20世纪50年代受苏联大学运行模式的影响，合并院校、学科、专业，搞国家战略，直接服务国家经济社会发展需要；相对来说，发表论文、出版著作，没有放在最重要的位置。80年代改革开放后，受美国大学运行体制的影响很大，强调论文发表，特别是国际期刊论文发表，成为国内大学的时尚。应该说，后一种影响成为中国大学的主流，才引发上述的连锁反应。

论文发表是评价当代大学学术的一个重要因素。从本质上说，科学发明发现需要借助论文这一形式得以呈现，这是呈现科学发明发现成果的一种重要方式，但远不是唯一的呈现方式。若是认为论文发表就等同于科学发明发现，那是一种误解；而只看重论文发表，漠视科学发明发现本身，则是一种歧途。从根本上说，论文发表是科学研究及其成果的交流方式，“嘤其鸣矣，求其友声”，是为了求得共鸣或批评，使成果得到验证和丰富。有研究、有成果、有发现，才会有论文，这是论文的本质。但是，这一本质在近代以来受到侵蚀，被异化为功和利、名誉和社会地位的载体，驱动这一异化进程的，是资本运动过程中的专利制度，科学发明的利益至上诉求。这些方面首先侵蚀了科学发明的神圣性，而近代美国大学的评价体系进一步把这一本质异化为工具理性，直至把科学发明置换为论文发表本身。现在，即使在美国一些排名比较靠前的高校，虽然聘任合同里并没有具体发表指标，但其教师在Science、Nature或者影响很大的社会科学刊物上发表论文，一直很受重视，被作为岗位聘任、职称晋升的标准。在最严格的意义上说，科学论文是科学进展的体现，可是，一旦这一共识被工具化，科学研究及其发明与论文之间的联系就会被割裂，论文就会成为其他因素（例如利益、地位、职务、声誉，等等）的载体。为发表而发表是最浅层次的异化，至于为升迁、基金、声誉、地位等伪造数据，以及花钱购买发表权，甚而绑架政府和民意，这就走到科学研究和论文发表原意的反面了。

在国际高等教育中，论文发表从来不是唯一标准。中国高校如此，俄罗斯高校如此，西欧高校也是如此。美国大学的实用主义和科学主义传统要比欧洲大陆更强，比较重视科研论文发表，但它采取科学发表和社会服务两套评价体系。我们总是一说西方就是美国，但实际上美国不等于西方，西方大学也有不同的趋向，西欧有西欧的做法，美国有美国的做法，俄罗斯有俄罗斯的做法，西欧的那些大学不一定瞧得上美国的大学。那些欧洲传统影响很深的国家，大学更加强调人文传统。

1980年代以来，中国大学在学习美国大学管理体制的过程中，越来越强调论文发表及其刊物等级。其实，中国学者骨子里还是比较抗拒以论文发表为评价标准的，更强调人文修养、思想性和真理性。在中国学术发表体系里，论文发表很多不是社会评价，而是编辑评价。过于重视发表，接近于把发表的编辑评价等同于社会评价，反而可能与科学真理、文化思想和学术评价越来越疏离。早期中国的思想家和学问家，没有什么刊物载体，往往通过友朋同道或授徒传播自己的思想，后来有书籍借以传播。他们地位之重要性，不看发表了多少文章，甚至也不单看写了多少文章。例如周敦颐写得很少，地位却很高。现在很多大学学习美国大学以发表作为核心评价标准，围绕它建立考核体系，这实际上应该从两个方面来看：一是教师个体方面，二是大学管理制度方面。教师个体中间普遍存在抵触情绪，并不认同指标化论文发表就等同于科学研究，等同于产出科研成果；而大学管理制度方面则正在探寻一种兼顾兼容的评价模式。我的理解是，从1980年代到21世纪之初，中国大学管理处在一种规范化管理的过程中，不仅制度层面上如此，科学研究工作的评价体系上也是如此。因此，量化指标体系进入中国大学，实际上体现的是这个进程中过渡性的历史作用，但它不是我们对大学管理和科学研究最终的方向和本质的认识。在这个过渡和转型过程中，出现了论文是论文、论文不等同于科学发明发现的“论文工具理性观”，以及对“论文=科学发明发现”的质疑。

事实上，中国大学至今仍然兼顾学术思想评价与量化管理，有一手软一手硬的特点。“硬”的方面是量化管理，主要包含论文发表、课题和奖励三大块。无论论文发表、课题还是奖励，都要看等级，论文看发表刊物的等级，与论文内容没有多大关系；课题也看等级，与课题研究的内容没有多大关系；奖励也如此，看是哪一级别的奖励。“软”的方面则看个人的学术思想水平、实际贡献和业内评价的高低。弱化量化管理和数字管理的趋势，在好的大学里越来越明显；而在“爬坡的”大学里，则仍然在加强量化指标。因为处在爬坡层次的大学，需要适应政府管理体制的评估，而评估依靠的就是量化指标体系。正是因为“软”的方面一直没有消失，这种传统一直存在，这是中国大学的教育一个很好的传统。大学管理评价体系的量化倾向越来越强，对这一倾向的制衡也越来激烈，“软”“硬”之间矛盾越来越明显。

“软”与“硬”两个方面怎样结合起来，是一个生态问题。我们的文化教育传统与大学现代化过程中引入的量化管理体系需要结合起来，偏废哪一端都不行。量化考核在现代大学里面已经成为工作的机制，大学管理不可能不搞量化，量化管理也要适应现代社会发展，自然科学和技术工程科学领域的管理尤其如此。但仅仅只有量化考核也不行。偏执于论文发表等方面的量化管理，或者偏执于非量化的人文思想水平评价，都不能够使大学具有活力。这两者要结合起来，我觉得这是中国大学一直需要追求的东西。

绩效考核的弹性机制

与考核标准相关联的是考核方法的变化。现在流行的考核方法是任期制加年度考核。年度考核与聘期考核是两种身份的考核。年度考核是体制类考核，全中国所有事业单位都有年度考核，在合格水平线以上的累计一年工龄，这一考核不是评优式的绩效考核。履职无差错，每年考核合格，到退休时候就可以合理地拿到一份退休金。不管聘三年还是五年，每年都得考核，这与聘期制存在一定的矛盾：既然签订的是聘期工作制，那么年度考核就多少有点多余。

聘任期考核是绩效考核。我们说的考核体制引起很大争议，指的是聘任制的绩效考核。绩效考核会有优、良、中、差，有晋升、不晋升或降级的区别，与此相配套的是不同的薪酬待遇。绩效考核的三大核心指标便是论文发表、课题承担和奖励。工作绩效的量化管理，就是在聘期内发表多少论文，申报什么样的课题，获得什么样的奖项等。这些可量化的指标决定升迁、奖励、晋级或者降级。除此之外，还有一些共同的指标和工作内容，例如承担本科生、研究生的教学任务，承担社会的和公务性的工作，组织研究活动，完成其他的社会活动等。这些共通的水平标准一般不可量化。

传统比较深厚的好的大学，还讲人文传统和学术贡献力，并不把学术贡献力与上述三个可量化指标相等同。这逐渐成为一些好大学的一个标志。大学分“211”“985”以来，量化评估体系逐渐推广，促成了一个风气，认为好的大学、好的教授就是论文发表越来越多，发表的刊物“等级”越来越高，课题越来越多，越来越大，奖励越来越高，这三个领域的竞争非常激烈。近几年一些好的大学的量化考核开始有所松动，开始考虑分类考核，不同的群体采用不同的考核方式。比如，一些基础学科和长线学科、一些公认有成就的学者，加大考核的弹性，一般不再做量化考核；在聘任期绩效考核中逐渐取消年度考核，不再要求每年发表两篇、三篇论文，或者一个聘期内必须发表三篇、五篇论文，而是强调研究工作的意义和质量。比如北大就强调论文原创性的重要性，不再强调一定在SCI、EI或所谓“权威刊物”等期刊上发表。发表在一般学术刊物上，但在学术圈内评价好，也是好的。有的大学二级教授不再做年度考核，依据他们的工作周期开总结会或成果发布会，以此替代绩效考核。而在别的方面，例如引进的国家级顶尖人才、杰出青年学者等类型，由于聘任的时候有工作目标，则仍然强调年度绩效考核。

这方面很有意思的是中国社会科学院。以前它一直坚持发表论文不论期刊级别，只要发表的论文有学术含量就可以，从来不搞高校常见的量化管理这一套。中国社会科学院不少老学者对高校的量化考核有强烈的批评。但是，从2015年开始，中国社会科学院也开始建立发表期刊的等级制，开始讲CSSCI、讲权威核心期刊。当不少大学逐渐走向淡化和超越量化标准，例如不再以发表期刊的等级等同于论文的质量，中国社会科学院反而开始搞量化管理了。这是很有趣味的动向。

今天大学的考核体系不可能回到工业化、现代期刊制度及大学管理体制初创之前的非量化时期；也不可能建立一种标准量化的考核模式，推行于所有的研究领域、所有的群体、所有的工作。例如，对于高校党务工作者的考核，就不可能与教学科研人员一样。中国大学评价体系比较理想的状态应该是弹性的，非标准化与量化相结合的。每一个大学可以根据自己的地位、工作重点和发展方向去制订适合自己的考核方式，把“硬”的量化考核与“软”的学术评价的权重控制在一个合适的范围内。一些群体的考核可以业内学术评价的比重大一点，另一些群体也可以更多强调量化考核。有些大学可能量化的部分多一点，有些大学可能不是这样。

政府管理体制对大学评价体系的引导

目前中国大学有较多的量化管理，也不只是大学自己造出来的，而是综合性的大学管理体制的一个特征。无论是水平式的年度考核，还是聘任制的绩效考核，这些评价标准都不是孤立的，在根本上都是与政府的管理体制联系在一起的。无论是评定期刊等级、申报课题，还是奖励，一个非常重要的原因是，相关政府职能部门（不仅仅是教育主管部门）需要把它们用作评价标准，这些标准可以为各种资源划拨、财政拨款和行政监管提供一种合理解释。目前对中国大学教师考核评价体系影响最深的，是政府主管部门对高校及学科的考核评价体系。

经过多年的大学管理体制改革和建设，例如院校合并、“211工程”和“985工程”，中国大学形成了一定的分层，这种分层现象的利弊近年来也引起了很多讨论，并推动了相关政策的调整。例如，此前有媒体报道，中南大学校长张尧学讲话时透露，国家把“985工程”和“211工程”取消了，曾引起舆论广泛讨论。

“211工程”和“985工程”计划的提出，包含了中央对于中国重点大学高水平发展的良好愿望和诉求，即中国这样一个大国，需要建设一批好的大学，无论自然科学还是哲学社会科学都需要有好的创造性研究，培养好的学生，直接服务于国家发展战略。要落实这些高校建设规划，需要制订出一套评估和考核的标准，这些标准需要外化为各领域的政府职能部门和大学都能接受的数据：政府职能部门能够通过这些数据来管理、拨款和监督，大学也可以通过这些数据来获得财政拨款和资助，推动学科建设和学术发展。但在这些规划实施过程中，中央所强调的科学研究、学科组织、人才培养等领域的建设时常被放到次要的位置，争取各种利益的诉求和行动占据越来越重要的位置。这些规划推动形成的中国大学分层现象，也使得不同大学之间的差距日益扩大，与强调教育公平的方向也存在矛盾。

“211”和“985”的经费主要根据重点学科拨付。从这些工程的本意来说，“211”的学科、“985”的学科并非“普惠式”的，即有些排名很靠前的学校，有些专业未必列入“211”重点学科；而有些相对靠后的学校，有些专业也是“211”重点学科。这样便会出现资源叠加的现象，一些学校的某个重点学科可能有三五个身份，既是“211”重点学科，也是国家重点学科，同时还是教育部的某种基地、省市重点基地等，每一种身份都意味着有一笔经费投入。但是同一批人只能做有限的事情，于是这些成果需要同时对付多种身份的考核，焦虑便不可避免地产生了。身份较多的学科自然要申报各类项目和奖项，以这些作为绩效，还要完成从预算、执行到检查的一些程序，这就不可避免要填报各种表格。这是教授忙于填表的现象的一个重要成因。如果只有一个身份甚至没有这些身份，这种烦恼便相对会少一些。

这样一来，同一所大学的不同学科便会有分层，例如国家重点学科、一级重点学科、博士点学科、省级重点、市级重点、校级重点等，包括教学改革、人才培养也会有国家级人才之类的等级区分。这些分层都需要确立一定的可量化的标准，它们也是与政府对大学管理体制联系在一起的。各个大学、大学里的各个学科，一般都希望在这些评估中获得较好的位置，于是便会进入日常考核之外的量化考核流程。

在这种量化评比的过程中，一种片面强调论文发表等级、获奖等级、课题等级的风气逐渐形成。从严格科学意义上说，评价科研成果，人们不仅会看发表刊物的重要程度，还会看论文本身的重要性，例如，不仅看是否发表在Science或Nature之类刊物上，还会看论文本身的重要程度，看是否有重大突破，等等。而在量化管理主导的情况下，人们往往会倾向于认为，发表在Science或Nature上就行，而不再考虑论文本身的重要程度，发表刊物的等级决定了论文的重要性，学术研究的社会评价和业内评价收缩为编辑评价。这就是所谓学术论文“工具理性”的驱动造就的。在这种情况下，编辑标准比较容易为利益所侵蚀，例如近年来舆论有较多批评的买版面等现象。一些学术期刊完全跟功利联系在一起了，有的恨不得一个月出几期刊物。舆论讨论已经注意到，目前学术生产链条的系列环节出现了一些异化状况，学术研究出现了非学术化和符号化的倾向。这些现象说到底是违背现代大学教育宗旨的。现代大学的根基在于学术研究和教学育人，以学术传承、文化传承和创造发现为己任，而不是以量化考核作为自己的根本追求目标。

作为政府的一种管理手段，“211工程”“985工程”这类举措对高校学科发展的影响非常大，既有贡献，也出现了一些问题。目前的难题是，当“211工程”“985工程”的存废问题被提出来之后，还没有找到政府管理大学的更好方式，特别是从财政上管理大学的方式。如果说当前不同大学之间分层有其问题，过于平均也会有问题。例如，很难根据各个大学的学生数，以人均水平的标准来拨款，如果这样也会造就一些学生人数庞大的航空母舰式大学，这也是违反教育规律的。不能漠视学校发展水准和学生质量的差异，仍然需要有差别的拨款方式。因此，如果没有“211工程”或“985工程”这类制度设计，以何种方式做出有差别的预算，便是一个关键问题。

综合考量，将大学推向市场，既要管大学的舆论和价值观，又让大学自己到社会上去找粮食，也不具可行性。如果将大学推向市场，市场类的大学不再是公立大学，政府部门便难以约束大学上什么课，用什么教科书、有什么价值观、培养什么样的学生。因而政府部门一直需要一些技术手段，无论是“211”“985”还是其他新的办法，把教育经费比较合理地分配到各种各样、各具特点的高校，仍然需要对这些拨款的执行情况进行考核。对于政府管理而言，“211”“985”工程之名，要废除有其道理，不废除确实也有其道理，存废之难在于是否能找到更合理的替换模式。

高校考核管理改革的简约化趋势

要减少目前出现的诸种异化现象，需要更好地协调政府的大学管理与教学研究发展之间的关系，以促进大学教研发展为中心推进管理体制的改革。说到底，高校教师的评价考核方式，与大学存在的身份、位置相关，与政府部门对大学的管理方式相关。近年来，为了克服目前高校教师评价考核出现的一些问题，高校考核管理体制已经进行了一些重要的改革。

首先，政府硬性评价的模式在调整。政府部门对高校的评价一般通过学校、学科、专业、课程等要素展开，例如2003年启动的本科教学水平评估、重点学科评估、学位点评估等，提出的口号是“以评促建”，中心意图是高校主管部门建立指标体系，评估结果让政府其他部门作为投入的依据，等于在“教育主管部门—高等学校—政府计划财政部门”之间建立一套游戏规则，个中的协商机制显得特别重要，否则对于高校和政府计划财政部门的压力是相当大的。但这套游戏规则的指向并非高校的本质，而是它的工具理性层面。在这一层面上运行，就难免使指标指向扭曲，即科研指标指向论文发表、课题层次、获奖等级，而不是学术本身；同时，也可能使评估变成变相的利益切割和分配。例如以前每年都会评比全国百篇优秀博士论文，现在已经不再评比；全国重点学科的评比也已经停止。停止对这些项目的评估，吸纳了大学和民众舆论反馈的意见。此前一种比较常见的批评是，这些评比明显变成名牌大学切分“蛋糕”，分完之后填到考核表上，谁有这些奖励和身份，谁就厉害。这些批评也推动了另一类调整，即不断扩大项目和获奖的数量和覆盖范围。评奖日益向普惠制的评奖转型，每一种奖项都兼顾部属院校与地方院校，兼顾发达地区与西部地区或落后地区。国家课题的设置也日益带有普惠制的特征，会特别兼顾西部地区和一些地方院校。

如果说，停止“211”“985”工程的传言，反映了一些大学校长的呼声，教育主管部门应该也意识到了其中存在的问题，那么，在国家财政性教育经费支出比例达到法定比例4%之后，关键问题是需要有新的能够更好兼顾教育公平和不同高校差异的管理办法。量化管理有其必要性，但教育经费分配的渠道越多，违背这些经费分配举措的原初动机的现象也会越多。对于经费使用者而言，虽然这些钱都会用来培养人才，但因为需要达到一系列量化标准才能争取到经费和通过考核，便会把相当部分经费用于其他渠道，例如花钱去买刊物版面发表文章、出版著作，甚至购买成果通过在出版物上做标示来交差等。为了克服这种恶性循环，简化考核管理体系，减少一些评比和经费分配渠道，是目前高校管理体制改革的一个重要趋势和特征。

其次，在简化高校管理体系的同时，提升高校自身的自主性和自我约束能力，会成为另一个关键问题。一种相对简单的管理方式是，把经费直接拨给大学，让大学自行分配，投入教师聘任、学生培养、公共运行、基础建设等领域，并改善对高校的监管；同时，大学自身的管理则既尽量少用评比等手段来主导教师的研究和教学，又让教师专注于教学研究的本职工作。如果教师仍然疲于应付各种项目申请和评比，则仍然很难将精力集中于研究和教学。以此为基础，大学管理可以更为注重导向问题，而不是设定固定的指标体系。

最后，简化高校管理体系的改革，需注重政府不同管理部门的协调。以专项经费为例，专项科研经费是专门为某一个重要事情、某一项重要工作设立的款项。专项科研项目一般是集体做的重大项目。这种专项工作与日常工作其实很容易混在一起。按理，专项工作意味着不是日常工作范围内要完成的事情，如果是日常工作，并不需要专项经费来做，传统意义上的拨款内部即可实施。但问题是，如果不是日常工作之内的事情，那么如何评估在专项工作中的劳动贡献？如果个人付出的劳动在专项工作中得不到体现，谁又愿意投入精力去做呢？另外，就把专项经费变成了日常经费的补充，把专项工作弱化为一种日常工作，这样在制度设计上便存在悖论。正因为存在这种悖论，在专项的具体运行过程中，人们往往会把专项经费用来解决日常工作经费不足的问题，这样便会出现“专项非专项化”的状况。例如，某一项研究工作专项，给参与工作学生有劳务费、给外请专家有专家咨询费，实施过程有耗材费、差旅费、会议费等，唯独没有考虑研究者的费用。这样的局面，既不利于调动教师的积极性，还会滋生一些违规使用、权钱交易和腐败的现象。

造成类似现象的原因在于教育经费行政化的倾向。从体制上看，缘自政出多门。从专项工作的管理体制来看，专项设立和评估由财政部门主导，教育主管部门主要是执行者，然后教育主管部门再把专项资金切分到各个高校。由于决策过程比较复杂，高校教学和研究的特点不一定在此一过程中被充分注意。如果要对专项管理体制有所调整，需要在决策过程中更多地了解和吸纳各个高校的意见和建议。

总体而言，高校评估体系改革需要从宏观和微观同时着手。宏观上，需要更注重提升大学的自主性和自我约束的能力，通过较为简化的财政安排来引导高校教学、科研人才培养等工作，尽量减少用各种评比或专项来影响高校运行。微观的调整办法主要是调比例，提高文化学术贡献的权重，在评估体系中更强调学术贡献、更强调思想力、更强调真理本身的分量。相对而言，宏观的引导更为关键。