本文为《智库与教育评价大师课:基于标准的评价与回应式评价》一书译者李刚教授为该书所作之序。
人类社会的进步取决于学习的意愿、方式和效率。评价是一种古老而自发的学习方式。孔子曾提倡一日三省,反省反思反求诸己都是从自我出发的评价路径,是中国评价思想的源头。如果说孔子提倡的是个体自身的反思,那么司马迁提出的“究天人之际,通古今之变”历史哲学则是一种集体行动逻辑的评价路径,他希望通过对历史的研究,获得社会演变的规律。和浩渺宇宙相比,人的确是沧海一粟,命运沉浮由不得自身,充满了随机和偶然。但是人是会思维的芦苇,他的尊严就体现在思维能力。无论个体层次还是集体层次,人都希望通过对历史经验和历史教训的总结,发现和掌握一些规律性的东西,从而获得某种确定性,在自然和社会变迁中拥有作为人的自信和尊严,实现从自然王国到自由王国的跃迁。
从现代评价的思想、框架、流程和方法看,所谓历史研究完全可以看成是对历史事件、过往制度、社会实践的评价活动。作为史学大国,中国有深厚的历史记录与研究的传统,《资治通鉴》则是历史评价的旷世杰作。熟读《资治通鉴》的毛泽东是历史评价的大师。1965年,毛泽东与程思远谈话时说,“我是靠总结经验吃饭的,以前我们人民解放军打仗,在每个战役后,总来一次总结经验,发扬优点,克服缺点,然后轻装上阵,乘胜前进,从胜利走向胜利,终于建立了中华人民共和国。”正因为是“靠总结经验吃饭”,他才写出了《中国革命战争的战略问题》、《论持久战》、《新民主主义论》、《论十大关系》等重要著作。总结是一种历史研究,也是最常见的一种评价方式。各种形式各种层次各种类型的“总结”,是中国共产党治国理政的主要方式。
评价作为现代社会广泛使用的治理和管理手段存在于各行各业,但是只有一部分行业在开展评价实践的同时积累了较为丰富的评价评价理论、方法、技术知识体系,形成了评价的专业体系。评价如果从学科领域来分大致可分为经济评价、教育评价、公共管理评价、战略与安全评价、学术评价等等。如果从评价对象,也就是评价客体来分大致可分为项目评价、活动评价、机构评价、工程评价、资产评价、人力资源评价、信息评价、数据评价等等;如果从评价的主体性质来分,大致可分为政府评价、国际组织评价、社会评价等等。第三方评价是一种特殊的社会评价,指的是评价主体委托的和评价客体没有利益冲突的专业机构开展的评价。目前,安全评价、战略评价、风险评价、绩效评价、学校评价、学科评价、机构评价、HR评价、项目评价、资产评价、价值评价、学术评价等主题积累了比较丰富的领域性评价知识系统。
西方系统的社会项目评估最早出现在教育和公共健康领域。第一次大战之前,最具代表性的就是扫盲、职业培训以及为降低死亡率和流行病发病率所实施的公共健康项目。20世纪30年代,各学科的社会科学家开始致力于用严格的研究方法评价社会项目。比如,列文(Lewin)开展的行为研究,西部电器实验发现的“霍桑效应”,都是这个时期著名的评价研究。二战时期,斯托福及其同事开发了用于监测士兵士气的方法、评估人格的策略。二战后,为了满足城市发展、职业培训、预防疾病,联邦政府和基金会等社会组织投入大量资金资助此类项目,为了测量项目效果,项目评估变得非常流行。美国和欧洲都广泛采用评估方法。这个时期,抽样调查、高级统计方法和公共项目管理知识的进步也使得大规模、多维度的评估评价活动能够顺利实施。20世纪60年代,评估评估成为一个快速成长的专业领域。最迟到20世纪70年代,评估评价研究已经成为社会科学的一个重要学术领域。
一个领域的专业化程度体现在学术体系、话语体系和学科体系的发育和建设水平。具体而言,就看专业知识体系的完备性、学术组织的号召性和活跃性、学术期刊的权威性、学科的建制性。
严肃的专业期刊是专业成熟的一个重要标志。1976年,《评价研究》(Evaluation Review)创刊,逐渐成为评价行业的旗舰杂志,现在这个行业的期刊已经超过10种。专业组织的出现说明这个专业的同行规模已经较大和交流活动也日趋频繁,需要成立专业组织开展行业治理。1986年,美国的“评价网络”和“评价研究协会”合并成立了“美国评价学会”(The American Evaluation Association ,AEA)。美国评价学会(AEA)是一个国际性的专业评价工作者协会,致力于项目评价、人员评价、技术评价等多种评价形式的应用和探索。AEA的使命是改进评价实践和方法,增加评价的使用,促进评价作为一种职业,并支持评价对产生关于有效人类行为的理论和知识的贡献。AEA有大约7300个会员,分布在美国所有50个州以及80多个国家。AEA的会刊是每年四期的《美国评价学报》。AEA还编辑出版了只面向会员的《评估动态》,提供这一领域的最新进展。
现在全球评估方面的专业学会和协会也有近10个。除了AEA,还有美国政策分析与管理协会(APPAM)、美国教育研究协会评价委员会(AERA)、加拿大评价协会(CEA)、澳大利亚评价学会(AES)、欧洲评价学会(EES)、英国评价学会(UKES)、德国评价学会(GES)和意大利评价学会(IES)等。
评价专业的专家们经常遭遇“评价是一门科学吗?”这样的疑问。要回答这个问题,最彻底的解决方案是在著名大学里能设立完整的评价学研究和人才培养建制。但是一个学科的学术积累达不到一定的深度和广度,没有生机勃勃的行业实践形成现实的人才需求,是不可能在大学里设立研究生和博士生专业的。一个被现代社会承认有影响力的应用性社会科学领域,一般积累了相当的知识体系,形成了范式性的学术经典。1972年,Weiss出版了第一本评价学教材《评价研究:项目效益评估方法》(Evaluation Research: Methods of Assessing Program Effectiveness)。这方面堪称经典的出了已经出到第七版的Evaluation: A systematic approach。该书是美国评价学专家Rossi,P、Lipsey,M和Freeman,H的合著。另外一本堪称经典的综合性评价学杰出专著就是本次出版的Standards-Based and Responsive Evaluation(《标准评估与回应式评估》。为了让更多的人了解本书,出版社建议译者改为现在这个书名,这也是完全可以理解的,就本书作者的学术和业界地位而言,称其为大师并不过分)。本书作者斯特克·罗伯特(Robert Stake)1958年获得普林斯顿大学的心理计量学博士,1963年入职伊利诺伊大学,从事评价工作,1975年任“教育研究与课程评价中心”(CIRCE)的主任,在教育评价领域有长达45年的教学、研究和行业实践经验。1988年,他获得了美国评价协会颁发拉扎斯菲尔德奖(Paul F. Lazarsfeld Evaluation Theory Award),这是美国评价理论方面的最高奖项。
斯特克·罗伯特在评价理论方面的原创性贡献就是提出了“回应式评价”的理论与方法。这个理论完全颠覆了评价就是话语权的概念,这是对传统的定量、指标化和结构化评价理论与方法的一次革命。这是着眼于解释和理解评价对象,超越评价主客体两分法的更具人文关怀、更加个性化、更具建设性的评价理论。“回应式评价”对于机构内部的各种活动和项目的评价无疑更具价值。因为机构要发展,内部评价是必要的手段,但是按照传统的量化的绩效导向的评价办法,只是区分了绩效的高低,对于绩效背后的原因并不清楚,也无法针对不同的人提出的不同的改进意见。我们很多单位评价评奖活动的后果就是制造了一大堆矛盾,起不到激励作用,原因就在于评价理论与方法的落后。“回应式评价”可以给我们提供完全不同的思路,把评价理解为信息与交流、叙事与对话、解释与理解、建议与改进的过程。2013年笔者到威斯康星大学麦迪逊校区的图书馆信息学院(现在该院已经改名信息学院并入该校计算机科学学院)进修信息科学、图书馆学和档案学。在选修评价学课程时,教授上课用的教材就是斯特克·罗伯特写的这本Standards-Based and Responsive Evaluation。教授上课时强调任何项目,特别是博物馆、图书馆、档案馆和艺术馆等公共文化机构的针对用户开展的活动,在设计时就要包含效果评价,评价是此类项目质量测量的主要办法。因此,评价理论与方法就是图书馆学信息学研究生需要掌握的基本知识。
这几年我们课题组开展智库评价的研究与实践,一直感到理论准备的不足,我们国内几种主流的智库评价方法(包我们的MRPAI)基本都是受到传统评价理论影响比较大,对于回应式评价理论了解很少。因此,我们决心把这本经典教科书翻译出来,不仅供智库界参考,也给教育学、社会学、公共管理等学科的研究生培养提供一本重要的教科书。
翻译这本书我们吃够了“苦头”,不仅是因为我们自己的知识准备不足,还因为这是一本理论性较强的专著,虽然作者已经尽量写的生动诙谐,可是有些地方我们理解起来仍然难度不少。初稿翻译出来后,王传奇博士正好去伊利诺伊大学,他带着书稿到书稿的诞生地请教作者本人,澄清了一些问题。我还是不放心,又邀请评价学专家南京理工大学拜争刚教授把关,校译了全书,然后再三修改,历时三年,才把译稿提交给出版社。
我相信其中错误肯定还是不少,希望读者批评指正。