第三节 国内外研究及实践现状

科学研究需要站在巨人的肩膀上,只有吸取前人的理论成果和实践经验,方能找准自身研究的切入点和突破口。为了全民健身公共服务绩效指数公共服务绩效指数的科学、客观的构建和实证检验,必须对当前相关理论和实践进行梳理和整合,推进研究更严谨、更合理地纵深发展。

一 国外相关研究现状

(一)国外公共服务绩效评估研究

公共服务绩效评估的概念主要是从政府绩效评估衍生和借鉴而来的。严格意义上讲,二者不论是被评估对象还是评估所涵盖的范围都存有一定差异。一方面,从政府的主要职能来看,公共服务职能与经济调节、市场监管以及社会管理职能是相互并列、同等重要的职能,政府绩效评估的内容包含这四个方面,因此公共服务职能比公共服务绩效评估在评估范围上更加宽泛。另一方面,在当前经济全球化、市场化的现实条件下,公共服务的供给主体也日趋多元化,使得公共服务绩效评估的对象也悄然发生了变化,既包括政府也可以涵盖市场主体、社会组织甚至是社会公众,而政府绩效评估的对象仅仅指政府本身。但是根据社会发展需要和公民自身需求,政府作为供给公共服务的责任主体的本质不但没有发生变化,政府的角色和作用反而更加重要。此外,随着新公共行政学新公共行政学、新公共管理以及新公共服务等理论的不断发展和完善,公共服务成为世界各国政府职能范围内管理活动中最为重要的职能之一。因此,当前学术界早早达成共识,认为政府绩效评估正逐步向以公共服务为主要内容的方向转变。即政府绩效评估也就是政府要在确定公共服务供给的数量、质量和价格标准方面抓好绩效管理,对保障社会公平、提高公共服务质量、更好地满足顾客需要等活动的绩效进行评定。

因此,对公共服务绩效评估展开研究,必须从考察政府绩效评估的历史开始。政府绩效测量和评估相关的实践活动的出现略早于政府绩效评估理论政府绩效评估理论的出现,最早可以追溯到1906年布鲁尔等人对纽约市政公共部门的绩效考评。从20世纪初泰勒泰勒在《科学管理原理》中提出针对工商企业的绩效管理制度,到法约尔法约尔《工业管理与一般管理》中将绩效管理方法推广运用到其他组织和机构,再到20世纪30年代末克拉伦斯·里德克拉伦斯·里德(Clarence Reid) 和赫伯特·西蒙赫伯特·西蒙(Herbert A.Simon)运用量表首次测算了市政工作的绩效并构建了包括行政管理工作与公共服务等多项内容在内的评估标准,最后到20世纪50年代美国将绩效管理运用到预算工作中,绩效管理和评估理论被逐渐运用到政府管理工作之中,大约经历了半个世纪的时间。

之后,政府绩效问题开始受到学者们的极大重视和强烈关注,到20世纪70年代,英、美等发达国家纷纷推行以新公共管理运动为核心的政府行政管理改革,主张在公共行政管理中参考企业管理理论,将市场竞争机制、目标管理、绩效评估和成本核算等方法应用于公共行政领域,以改善公共行政绩效,提高政府服务的质量和水平,满足公民对“政府再造政府再造”的客观要求,形成了企业家政府理论[8]。目前,以公共服务为主要内容的政府绩效评估已发展成西方发达国家行政改革的重要内容和根本性措施,并逐渐演化为一种世界性潮流。目前,国外已经有大量的科学研究和论文著作对政府绩效评估进行了讨论和分析。根据所获得的文献资料,现将相关研究述评如下。

1.公共服务绩效评估的方法运用

西方公共服务绩效评估价值取向的转变必然伴随着评估方法的更新换代。公共服务绩效评估价值取向对应着两个评估方法。

第一,度量政府公共服务的效率,即计算政府投入与产出比的方法。“数据包络分析法数据包络分析法”(Data Envelopment Analysis,简称DEA) 是目前学者们最为青睐、使用率最高的方法。DEA是一种线性规划模型,通过对一个部门的效率和一组提供类似公共服务的部门进行绩效比较分析。例如,有学者采用DEA方法对各个领域的公共服务项目进行过分析,如城市公共交通服务[9]、公共卫生健康服务[10]、公共文化服务[11](公立图书馆服务)以及公共医疗服务效率等。此外,还有一些学者运用“非参数方法非参数方法”(Free Disposal Hull,简称 FDH) 或“随机前沿分析随机前沿分析”(Stochastic Frontier Analysis,简称SFA)的“参数方法”分析公共服务绩效。FDH是DEA方法中的一个分支,是利用来自总体的样本对总体的某些参数进行估计或者进行假设。例如,维特维特[12](Witte)使用FDH方法构建了一套公共图书馆服务的条件效率理论模型,并从政策上提出了公共图书馆未来发展的建议。而SFA是一种在生产前沿理论的基础上发展形成的参数方法,它被广泛用于公共医院的预算效率评估和卫生改革领域。

第二,衡量政府公共服务的结果,即测量公众满意度的方法。其本质是度量民众对于公共服务可感知的效果与自身期望比例的量化模型。在理论界,学者们多采用多元回归模型多元回归模型(Multivariable Linear Regression Model,MLRM)以及结构方程模型结构方程模型(Structural Equation Model,SEM)的方法了解相关变量对于公共服务质量的影响程度,采用问卷形式收集相关信息。目前,国际上对于公众满意度的测评方法已经有了长足的进步,并形成了多种成熟的测量工具,广泛用于公共服务满意度的绩效评估实践中。虽然测量方法有很多,如KANO模型KANO模型[13]、SERVQUAL模型[14]和QUADRANT模型QUADRANT模型[15]。但是从宏观角度来看,“顾客满意度模型”(CSI)是学界和业界都最为推崇的方法。基于最初的CSI模型,目前世界许多国家早已经开发了适合自身国情的顾客满意度的相关测评模型和方法。比较经典的有瑞典的SCSB模型、美国的ACSI模型以及欧洲的ECSI模型,它们构成了当今满意度测评的基础方法体系。随后,这些模型被广泛应用于公共部门的满意度测评中,至今已有20多年的历史。如学者格雷·雷兹就在美国ACSI模型基础上进行了完善和修正,提出了适用于纽约公共服务满意度测量的新模型,并应用于测量美国公共交通的市民满意度[16]。还有学者对美国ACSI模型进行完善,开发了新的国家公民满意度指数模型国家公民满意度指数模型(National Citizen Satisfaction Index,NCSI)[17]

上述两种公共服务绩效评估的方法,各有其优缺点。采用 DEA、FDH、SFA 等测量公共服务绩效的方法,数据搜集比较方便、公共数据真实可靠,计算结果可信程度普遍比较高;但是其缺点是只关注公共服务的效率和过程,没有适应当今公共服务绩效评估的新价值导向趋势,对于公共服务强调的公平性、回应性回应性和满意度等主观指标缺乏测量。基于多元回归以及结构方程模型结构方程模型的公众满意度模型需要投入巨大的人力、物力和财力去搜集数据,数据可信程度没有公共数据那么高,且对研究者的数理统计知识有较高要求,研究成本比较高;但是该种方法的运用对于公共服务质量的改善有直接效果。因此,这就需要我们在下一步研究方法的选择上注意二者的结合,不能偏废其一。

2.公共服务绩效评估的内容维度

公共服务绩效评估的价值取向是其灵魂主旨,方法使用是其有效工具,而内容维度则是其基本框架。采用什么样的指标维度直接反映了公共部门对于公共服务的要求,同时,指标维度的选择也是体现公共服务绩效总体状况的具体量化依据。纵观当今国际上对于公共服务绩效评估的内容维度和指标设计,虽然不同学者在具体指标设计上会有所差异,但是最经常使用的三种指标为:第一,效率类指标,主要测量各个侧面的投入与产出比例;第二,结果类指标,主要围绕公共服务质量进行设计;第三,公平类指标,主要利用公众满意度进行测量(见表1-1)。

表1-1 不同学者和机构对于公共服务绩效评估内容维度的关注情况

(二)国外有关公共服务绩效评估的实践尝试

公共服务绩效指数公共服务绩效指数(Public Service Performance Index),是目前国外运用比较成熟的评估公共服务绩效的评估方法。它是运用统计学方法所形成的反映一个国家或者一个地区某一级政府公共服务绩效状况变动趋势的相对数。目前,由于地区与地区、国家与国家之间政治、经济、社会、地理环境的不同,国际上并没有一套统一的、公认的衡量公共服务绩效的评估指数。但是这并不等于该领域的研究和实践就停滞不前,国际上已经开发了一批被广泛应用且影响力较大的社会统计指数,本书选取与公共服务绩效紧密相关的统计评估指数成果进行分析,以期对全民健身公共服务绩效评估模型的构建有所裨益。

1.政府质量指数政府质量指数模型

政府质量(Quality of Government)测量标准的选择和测量方法的运用,对公共服务绩效评估模型的开发具有一定的指导意义。在《掠夺之手:政府的病理机制与治疗》一书中,史莱芙(Shleifer)和维悉尼(Vishny)主要探讨了影响政府质量的关键因素,并提出了一个衡量政府质量的综合指标,即政府质量指数政府质量指数[18](见表1-2)。

表1-2 Shleifer和Vishny的衡量政府质量的指数标准

由表1-2可以发现,该指数由五个维度构成,其中包括20多个子指标。该指数对研究主要的贡献在政府干预、官员体系的效率、公共产品的提供、政府的规模中的一部分指标可以为我国全民健身公共服务绩效的考察范围和研究提供很好的思路和借鉴。

2.人类发展指数人类发展指数模型

人类发展指数人类发展指数(Human Development Index,简称HDI),是联合国开发计划署在《1990年人类发展报告》(Human Development Report 1990)中首次提出的。之后,联合国开发计划署每隔一年制定一份测量联合国各成员国的人类发展水平报告,比较有代表性的有《2000年人类发展报告》(Human Development Report 2000)和《2010年人类发展报告》(Human Development Report 2010)。

HDI指数运用三个基本方面的平均成就来最终测量一个国家的人类发展水平,这三个方面包括健康长寿、教育获得(知识)以及体面的生活水平,分别用出生时预期寿命、平均受教育年限和预期受教育年限以及用实际人均GNI(购买力平价美元)来衡量。以2010年的人类发展指数人类发展指数算法为例:

首先,设计各维度指数=(实际值-最小值)/(最大值-最小值)

其次,使用三个维度指数得分的几何平均数将次级指数作为HDI指数的最后得分,公式为:

HDI指数是对传统的GNP、GDP等仅关注国家经济社会发展的指标体系的挑战。它更加强调政府的有效管理和实施的科学政策对社会互动的制度及对普通公民的尊重的影响,更加关注人类发展,认为人的发展是政府质量与社会福利因素综合作用的结果。HDI没有像政府质量指数政府质量指数一样过于偏重关注政府经济效率、内部控制以及权力实现等指标,而是体现了国家发展对公民个体福利的强烈关怀,这也为笔者的研究提供了新的思路。但是,HDI指数遭受的一些批评和质疑也带来了一些警示,即HDI指数的维度选择不能反映人类发展的全部内容,而且在算法上也只采用简单的几何平均法,没有对其进行加权,并且三个维度之间权重贡献度相同也显得没有科学依据。所以笔者在构建地方政府全民健身公共服务评估模型的时候,会尽量避免出现上述问题。

3.国际竞争力指数国际竞争力指数模型

瑞士国际管理学院(International Institute for Management Development,简称IMD)是当今进行国际竞争力研究组织机构中的翘楚,IMD和它出版的《世界竞争力年鉴》(World Competitiveness Year Book,WCY)在世界范围内影响力和美誉度都极高。IMD在经济学、政治学和社会学的基础上,通过利用统计指标和调查问卷的方式构建开发了“国际竞争力指数国际竞争力指数”。

2001年至今,国际竞争力指数国际竞争力指数的要素结构分为三个等级。第一等级包括四个要素(factors):经济运行、政府效率、企业效率以及基础设施。四个要素再分解出20个二级评价指标 (sub-factor),包括国内经济、国际贸易、就业、公共财政、基本设施、教育等。由于国际竞争力涵盖内容宏大且复杂,IMD 又将各二级指标中所涉及的多个方面分为不同的类别 (category),构成了若干个三级指标 (criteria)。在这些要素中,政府效率竞争力中的政府经济政策是否有效运用于现实经济中、政府对市民是否是透明、公共服务是否受政治干预、官僚主义是否阻碍企业发展、受贿和腐败在公共领域是否盛行,以及基础设施中的公共服务设施、科研成果、健康与环境以及教育等多个指标对于政府公共服务绩效,甚至对于全民健身公共服务供给效果的评估,均有很大的指导意义。

4.世界发展指数世界发展指数模型

世界发展指数世界发展指数(World Development Indicators)是世界上最重要的发展指标汇编。它提供现有的最新最准确的全球发展数据,其中包括国家、地区和全球数据的估计值。与政府基本公共服务绩效密切相关的指标有:(1)公共基础设施类指标,主要包括铺设道路百分比等;(2)公共治理类指标:主要有私人固定投资占国内固定投资总额的百分比、对私营部门的国内信贷占GDP的百分比等;(3)公共财政类指标,主要有税收收入占GDP的百分比、中央财政收入占GDP的百分比、社会保障税占中央政府经常性收入总额的百分比、所得税利和资本利得税占中央政府经常性收入总额的百分比、中央政府财政总支出占GDP的百分比、补贴和其他经常性转移支付占中央政府总支出的百分比、资本支出占中央政府总支出的百分比、工资和薪金战中央政府总支出的百分比等;(4)卫生类指标,公共卫生保健支出占GDP的百分比、每千人拥有医生数、每千人拥有病床数、可获得安全饮用水的人口所占百分比、可获得卫生设施的人口所占百分比等;(5)科技类指标,包括每万人中从事开发和研究的技术人员、高技术出口占制成品出口的百分比等。以上这些指标,对于本书所要构建的全民健身公共服务指数具有间接的启示和借鉴意义。

(三)国外大众体育服务绩效评估研究

西方学者对大众体育服务绩效评估的理论研究是伴随着大规模的体育活动调查实践开展而逐渐兴起的。由于国外大众体育服务在管理体制、机构设置、运行机制以及政策实施等方面因各自国家的政治体制、经济水平和传统文化的不同而有所差异,从而导致国外发达国家在大众体育服务绩效评估方面的研究重点也略有不同。西方各具特色的大众体育服务绩效评估研究主要围绕“非营利性体育组织非营利性体育组织绩效评估”“公共体育设施服务绩效评估”以及“公共部门体育政策评价”等方面展开。

1.国外关于非营利性体育组织非营利性体育组织绩效评估研究

非营利性体育组织非营利性体育组织包括政府公共体育部门、体育社团、体育协会、体育基金会、体育志愿组织等社会体育组织。非营利性体育组织非营利性体育组织的服务质量与绩效评价是国外学者关注的热点问题。

弗里斯比[19](Frisby)早在1986年就对国家体育治理机构国家体育治理机构(National Sport Governing Bodies,NSGB)进行了定义,并结合目标达成和系统资源两个发展比较成熟的绩效评估模型,对加拿大多个体育治理机构(样本数量不详)的组织成效和组织结构之间的关系进行了分析,结果显示体育组织的结构在一定程度上影响组织成效,但是他没有提出测量体育组织成效的具体变量指标。维尔[20](Vail)在自己的学位论文中同样探讨了国家体育治理机构国家体育治理机构的组织绩效问题,通过对33个国家级非营利性体育组织非营利性体育组织的负责人发放140份问卷,最终将影响该类体育组织绩效的因素归为六个维度,即组织的适应性(adaptability)、组织沟通(communication)、组织财务(finance)、组织成长(growth)、组织人力资源(human resources)和组织计划(organizational planning)。他将非营利性体育组织非营利性体育组织的人员分为具有不同目标预期的五类群体,即组织的主席、组织的运行主管、国家队教练、合作赞助商以及其他组织成员,分别调查了他们对于组织绩效六个维度的关切程度,研究发现,组织的主席、组织的运行主管相较于组织其他成员更加关心组织的财务情况;而对于组织成长指标,五个群体的关切程度并没有显著性差异,均认为组织成长没有组织人力资源、组织计划和组织沟通三个指标对于组织的绩效影响程度高。维尔对于非营利性体育组织非营利性体育组织的研究,虽然考虑了组织不同参与主体的目标价值对于组织绩效的影响,但是研究并没有考虑反映体育组织特性和特色的指标。

科斯基[21](Koski)基于开放系统理论开放系统理论,以835个芬兰体育俱乐部为例,分析了非营利性体育组织非营利性体育组织的成效。他将体育组织的成效分为五个维度,分别为资源获得(obtain resources)、内部氛围(internal atmosphere)、生产流程效率(efficiency of the throughput process)、目标实现(realization of aims)以及活动总体水准(general level of activity)(见表1-3)。研究发现,五个维度都与体育俱乐部的绩效水平相关,而其中的资源获得、生产流程效率以及活动总体水准与组织绩效的相关程度较高,当会员数量与组织的内部氛围超过一定数量时,会呈现负相关关系,即会员人数越多,俱乐部的内部氛围可能越不理想,之后也会在一定程度上影响体育俱乐部的绩效。显然,科斯基将体育组织的特色绩效指标加入到研究设计之中,弥补了前人研究的不足。但是,科斯基的研究只是以社区的体育俱乐部为例,绩效评估指标的设置在包括多种类型的非营利体育组织绩效评估过程中的代表性有待进一步论证。

表1-3 科斯基芬兰体育俱乐部绩效评估指标情况

在此之后,有很多学者如钱勒迪莱钱勒迪莱等(Chelladurai et al.)、帕帕季米特里乌帕帕季米特里乌(Papadimitriou)和马赫·博伊斯兰得马赫·博伊斯兰得(H.mahe de Boislandelle)也分别对非营利性体育组织非营利性体育组织的绩效进行了颇有成效的研究,但是他们的文章都缺少对研究方法的具体描述。到目前为止,对于非营利性体育组织非营利性体育组织的研究较具代表性的学者来自法国,分别是马利·拜尔和奥博托·曼德拉奥博托·曼德拉[22](Emmanuel Bayle & Alberto Madella)。他们认为非营利性体育组织非营利性体育组织的绩效就是事先拟定组织目标,事后分析该组织目标是否达成的过程。绩效评价的难点在于非营利性体育组织非营利性体育组织的架构复杂,组织目标的确定受多方参与主体的预期所影响,不同的参与主体(包括国际体育组织、赞助商、俱乐部、会员、社区、媒体等)具有不同的目标预期,因此带来了组织绩效评估的困难。他们基于契约理论契约理论,通过概括总结当前用于测量非营利性体育组织非营利性体育组织绩效的方法,克服当前绩效评价方法的局限,构建了一套专门针对非营利性体育组织非营利性体育组织的综合绩效测量工具。这个绩效评价体系包含六个维度,即制度绩效(institutional)、组织结构绩效(organizational)、财务绩效(financial)、宣传绩效(promotional)、社会内部绩效(social internal)和社会外部绩效(social external),每个维度都有具体的测量指标和方法工具。之后,二人运用定性和定量相结合的研究方法,选取法国40个国家层级的体育协会(这些协会一共有17000个俱乐部和超过1400万的会员)作为研究对象,进行了实证检验。研究结果显示,40个非营利性体育组织非营利性体育组织的绩效按照得分从高到低,可以归为六个等级,即活跃力强的组织(the Mighty)、富有成效的组织(the Effective)、进退两难的组织(the Dilemmas)、非典型性的组织(the Atypical)、存在缺陷的组织(the Defective),以及发展困难的组织(the Problem)。

在国外,新近的有关非营利性体育组织非营利性体育组织的绩效评估研究已经不再拘泥于如何设计具体、微观地反映组织绩效的指标以及分析各个变量之间的相关关系,而是转向了更加宏观的视角。西方学者开始注重不同类型体育组织(体育社团、体育俱乐部、体育基金会和体育行政部门等)和不同体育项目组织(足球、篮球、田径、举重、赛马、羽毛球等)的绩效评估问题。同时,他们也开始侧重研究体育组织内外部不同利益相关群体以及不同体育组织机构之间的绩效评估互动,综合性的多方参与的绩效评估模式开始受到越来越多学者的青睐,这也启示我们在评估群众体育公共服务绩效的时候,要不断完善绩效评估制度,注重各方参与,兼顾各方利益诉求,使评估对象在组织目标制订及考核过程中都能发挥作用。

2.国外公共体育设施服务绩效评估研究

公共体育设施建设是国家体育事业发展的基础和必备条件,是保障公众参与体育活动的重要载体。国外很早就采用了政府和社会资本合作(PPP)模式,吸引社会资本、专业团队等参与到各类公共体育设施建设之中。在此过程中,随着公共体育设施建设的大规模开展,这些项目是否应该投资,投资多少、财政支出的经济效益、社会效应怎样,如何评价这些支出的成果等问题越来越受到政府部门、服务承接主体以及社会公众的广泛关注。因此,对公共体育设施实行科学合理的绩效评价就成为西方公共体育管理实践和学者一直以来的研究热点问题。

早在1997年,英国通过中央政府和审计委员会的密切合作,建立了“最佳价值审计最佳价值审计”评估指标(Best Value Performance Indicators或 BVPIs)体系,用来评估包括公共体育设施在内的地方政府公共服务的业绩。“英国体育理事会国家标准管理服务中心英国体育理事会国家标准管理服务中心”(Sport England’s National Benchmarking Service),在2000年构建了一套公共体育设施绩效评估的模型[23],用来计算公共体育设施(公共体育场馆和游泳场馆)在各个标准指标下的得分情况,并最终衡量每个公共体育设施的绩效水平。该评估模型主要从四个维度进行公共体育服务设施的绩效考核,分别为设施准入(Access,不同人群的使用情况);财务情况(Finance,政府补贴、设施中心的收入和支出情况);设施利用效率(Utilization,设施的使用频率);设施主观评价(Customer ratings,设施的重要性,用户满意度,不同的服务属性)。为了科学计算公共体育设施的绩效得分,“英国体育理事会国家标准管理服务”的数据主要有三个方面的来源:第一,用户问卷调查;第二,每个公共体育设施中心的财务信息表;第三,国家统计局的流域人口资料,这样的统计口径确保了绩效评估信息的真实性和可靠性。

此外,“英国公共服务卓越协会英国公共服务卓越协会”(Association for Public Service Excellence)的绩效评估网络涵盖地方当局的十四类公共服务项目,每项公共服务都有专门的绩效评估报告,专门针对体育休闲设施管理的绩效评估报告也是其中之一,主要提供公共体育休闲设施的管理运作、财务比例以及公众满意度等数据资料,具体的绩效评估指标[24]见表1-4。

表1-4 英国公共服务卓越协会英国公共服务卓越协会公共服务相关绩效指标

续表

相较于前两种公共体育设施的绩效评估,“英国体育理事会国家标准管理服务中心英国体育理事会国家标准管理服务中心”在社会包容性指标以及财务状况指标方面要比“英国公共服务卓越协会英国公共服务卓越协会”的绩效指标更加丰富和具体。虽然财务状况对于公共体育设施的可持续性发展非常重要,但是社会包容以及用户满意度在评价公共体育服务供给状况时显得更加重要。“英国体育理事会国家标准管理服务中心英国体育理事会国家标准管理服务中心”提供的公共体育设施管理人员的评估报告对于公共体育服务的发展战略、行动规划和未来的管理决策都至关重要。

此外,随着新公共服务理论新公共服务理论的影响不断增大,很多学者已经不单单将公共体育设施服务的绩效评估指标局限在经济、效率维度,开始以更加宏观、更加全面、更加人性的视角来分析和研究此类问题。刘易德[25](Yi-De Liu)就从社会正义理论出发,考察了1998年到2008年期间英国弱势群体使用公共体育设施的绩效情况,研究表明英国11岁至19岁的儿童以及年龄在60岁以下的残疾人使用公共体育设施的比例正在下降,并发现年龄在60岁以上的老年人在使用公共体育设施过程中存在很多困难。此外,他还指出不同种类的公共体育设施以及在不同管理模式下的公共体育设施,在不同社会弱势群体之间的绩效也存在显著性差异,他利用实证绩效结果提出了自己对于公共体育设施服务如何更好地使弱势群体融入社会的建议。Tseng ML专门设计了一套公共服务设施的绩效客观评估系统[26],并使用该系统评估了2005—2007年间英国三个公共休闲健身中心的绩效,研究发现,公共休闲健身设施的绩效评估系统最重要的评价标准是其休闲性程度、包容性程度和简单程度。

尽管我国已有很多地方和部门开始对公共体育设施进行绩效评估,学者们也开始了诸多理论研究,但从总体来看,我国的公共体育设施绩效评价仍处于起步阶段,理论研究还没有真正转化为可用的实际测评工具,并且在绩效评价的过程中还存在诸多制度和政策缺失。国外有关公共体育设施绩效评估的实践经验和理论研究成果给了我们很多启示,我们应学习国外先进的公共体育设施绩效评估理念,借鉴国外先进的公共体育服务绩效评估指标和绩效评估方法,使其为我所用,加快我国公共体育设施绩效评估理论研究的发展。

3.国外公共部门体育政策绩效评估研究

公共体育政策绩效评估指运用定量与定性相结合的科学评估方法、根据事先确定的标准,对政府公共体育政策执行的效益、效率与效果及其价值进行综合性的测量与判断。公共体育政策绩效评估是国外政府绩效评估体系的重要内容,近年来,对公共体育政策评估进行研究的学者越来越多,研究成果和实践案例不断涌现。

而在最近的研究中,布尔等人对现有政策审计工具(Policy Audit Tool,PAT)进行修订和完善后,发展了一套新的适用于不同国家不同地区的促进健康身体活动(Health-Enhancing Physical Activity,HEPA)的(Policy Audit Tool,PAT)。他们通过对芬兰、意大利、葡萄牙、荷兰、挪威、斯洛文尼亚和瑞士七个国家的促进健康政策领域的专家进行问卷调查,形成了一套拥有17个评价指标的体育政策分析工具,具体指标包含:政策制定和协商的方式;现有的政策依据;国家层面对于体育领域的政策指导建议;国家的体育战略和目标;政策有无具体的实施计划表;多样化的策略;政策的领导与协调;政策网络环境;政策伙伴关系;政策实施的政治承诺;政策的资金投入;健康监测系统;政策的评价;政策制定和实际情况的关系;政策的沟通策略;政策的身份认同;政策的跨领域整合性[27]。该项研究为今后各国公共体育政策领域的绩效评估提供了新的理论视角和研究方法,将各个部门对于大众体育政策的分析和评价视为政府实现大众体育治理目标的具体路径和手段,重新明确了大众体育政策绩效评估的意义和价值。

在实践中,国外发达国家的大众体育政策绩效评估可以分为两个大类,即以美国、澳大利亚、加拿大、德国、北欧国家为代表的“单项体育政策评估”和以日本、韩国、英国、法国为代表的“综合政策评估”,其中包括体育政策评估。

首先,在“单项体育政策评估”的案例中,美国早在1980年就由美国卫生与公共服务部(HHS) 颁布了《促进健康、预防疾病,健康公民 1990》《促进健康、预防疾病,健康公民 1990》,之后又在1990年、2000年和2010年分别颁布《健康公民2000》《健康公民2000》《健康公民计划2010》《健康公民计划2010》和《健康公民计划 2020》《健康公民计划 2020》,以《健康公民计划 2020》《健康公民计划 2020》为例,其中制定了 42个优先发展领域和近 600 个可量化的健康战略目标,规模和覆盖范围空前广阔与全面,通过每十年一次的追踪调查,实时监测民众参与体育状况,并通过在线访谈、家庭访谈和个人访谈的方式对民众开展健康公民计划的满意度调查,不断调整和完善政策制定的合理性和科学性。此外,美国另一项大众体育政策《国民体力活动计划》《国民体力活动计划》,以南卡罗来纳大学预防研究中心为核心,由包括美国体力活动研究中心和疾病防控中心的300 多个代表组成的统筹委员会制定并实施全程政策评估工作,该计划主要目的是精确地评估政策对于公民体力活动的促进效果,而不是其他因素[28]。加拿大也单独制定了详细的体育政策,如《体育推进计划》《体育推进计划》和《体育自主模式与责任框架》《体育自主模式与责任框架》(Sport Funding and Accountability Framework,简称 SFAF),SFAF 其中就由包括“绩效评估”在内四个主要部分构成,其他三项分别为“资格标准”“资助数额”和“签订责任制”,很好地指导了加拿大体育领域的融资活动。

此外,包括澳大利亚《活跃“澳大利亚”计划》《活跃“澳大利亚”计划》、丹麦的《健康生活2002—2010》《健康生活2002—2010》(Healthy throughout Life 2002-2010)、德国的《国家骑行计划》《国家骑行计划》(National Cycling Plan 2002-2012)、冰岛的《冰岛国家健康计划2010》《冰岛国家健康计划2010》(The Icelandic National Health Plan to the year 2010—abridged version)、爱尔兰《国家健康促进战略(2000—2005)》《国家健康促进战略(2000—2005)》(The National Health Promotion Strategy 2000-2005)、荷兰《国家儿童运动计划2004》《国家儿童运动计划2004》(National Plan of Action for Children 2004)等都是依托社会体育组织制定和执行体育政策,然后由非执行部门的专家学者组成独立的评估小组进行政策绩效评价,保证了政策实施效果得到客观、全面的评价,为下一阶段的大众体育工作和政策制定提供智力支持。

斯通(Stone)认为:“由于体育是联系社区、建立社会秩序和形成社会化的重要方式,因此体育政策的制定和实施就变得非常重要。”[29]格兰顿和泰(Gratton & Taylor)则通过文献整理,发现当前国外基于经济标准的体育政策分析和评估,例如体育设施的分布和体育资源的分配已经很充分。然而在讨论体育组织内部的政策制定和评估时,往往对于政策的内涵和分类方法不多,而且政策的修缮仅仅依赖于组织之间的协商和沟通[30]。Signe B.Daugbjerg等人[31]运用内容分析法对欧洲24个国家有关促进身体活动的49项政策进行了归纳和总结,并将影响这些政策有效性的相关指标归纳为8个维度,依次为:参与政策制定的部门和机构;政策的实施;政策的法律位阶;政策的目标群体;政策的战略和目标;政策的时间计划表;政策的预算;政策实施的评价和监督。之后,他们发现虽然目前欧洲各个国家颁布的有关促进身体活动的政策开始逐渐增多,但是学界依旧没有对欧洲整体的公共健康政策进行综合性的分析和评价。描述性统计方法也在该研究中得到运用,并对涵盖每个指标的政策数量进行了百分比分析。值得注意的是,有明确规定要求对政策执行和实施进行绩效评估的数量有15项,研究虽然没有对每项政策绩效评估的指标和方法做具体分析,但是明确提出目前欧洲各国的政策绩效评估依然是以注重结果为价值导向,需要加强对于政策执行过程的绩效控制。

除了上述国家采用“单项体育政策评估”外,还有很多发达国家采用“综合政策评估”模式对体育领域的公共政策进行绩效评估。这些国家倾向于颁布国家层面的政策绩效评估法案,对政府各部门的所有政策进行全面深入的评价,之后运用法案中的评估标准对体育领域的公共政策进行再评价。以英国为例,前文提到英国早在1997年通过中央政府和审计委员会的密切合作,建立了“最佳价值审计最佳价值审计”评估指标(Best Value Performance Indicators,BVPIs)体系,将包括体育领域在内的政府各部门的所有重大开支,以及政策在实施之前的各种建议,也纳入评价范围。在韩国,《政策评估框架法案》和《政府业务评价基本法》《政府业务评价基本法》等法案[32]规定的评价内容包括了政策结果评价、政策实施能力评价、公民对政府提供的服务和政策实施的满意度的调查三个方面,同样的标准和方式也运用到了《提升国民体育五年总体计划》中。而在日本,文部省颁布《关于行政机关实施政策评价的法律》中对体育领域的政策评估进行了明确指导;《体育振兴基本计划2000年》《体育振兴基本计划2000年》和《体育立国战略2010年》《体育立国战略2010年》等政策,都是根据文部省对于国家体育政策的基本要求,结合各地区实际情况制定发展地区体育政策和条例,设置指标性政策目标,进行科学的评估[33]。可以发现,这些国家的公共体育政策评估,都是建立在国家机关专门绩效评估机构和行政机关根据法律和组织原则的基础之上的,确保了绩效评估的权威性。

4.国外大众体育绩效评估研究小结

虽然在国外有关大众体育绩效评估的研究和实践案例还有很多,评估理念、评估方法、评估指标、评估主体也根据各自国家国情不同而有所不同,但是通过对国外发达国家的大众体育绩效评价的研究和实践做法,笔者可以清晰地看出以下特征。

第一,评估主体参与多元化,民众参与水平高。国外对于大众体育及全民健身的调查评估主体多为第三方机构(科研院所、高校研究中心或专门的民间评估组织等),在评估过程中,积极吸纳民间人士的参与,使政策评估不再局限于精英阶层,公众意志得到充分表达和尊重。例如,美国、英国等民众都能够主动、自愿地参与调查问卷或电话访问以及网上测验等各种信息搜集,保证了第三方评估机构获得政府绩效管理的有关大众体育服务的重要数据,提升了大众体育绩效评估的民主性。

第二,从评估的方法来看,在西方国家,评估方法多采用顾客满意度模型和简单的传统的绩效评估方法,包括简单比例分析和回归分析法。这种方法是一般组织最常用的方法,其优点为数据容易取得,计算简单易于了解。国外大众体育绩效指评估评分标准设计、评估模型的构造、评估的技术路径等都体现了以定性分析为基础、以定量分析为手段、十分注重细化指标设计的特征(以“英国公共服务卓越协会英国公共服务卓越协会”的公共休闲设施绩效评估为例)。

第三,从评估的内容来看,西方发达国家主要关注国民的身体健康、国民参与体育活动水平、国家体育设施的使用效率和公共体育政策的实施效果。评估指标具有全面系统但又重点突出、过程指标与结果导向结合、客观评价与满意度评价结合等特点。

第四,从评估的目的来看,由于西方国家对民主较为强调,从公共体育政策的制定到大众体育健身的公共部门的绩效评估研究和实践,都以满足公民健身需求为导向,通过各方面资料的汇集、整理、统计之后,评估的结果一般都利用新闻媒体或者网络渠道向社区居民公布,进一步明确国家、社区的未来体育发展目标,通过更好地整合各类资源使居民能够得到更多参与体育的机会。

总体来讲,虽然国外学者们从不同角度探讨了政府绩效评估中公民参与和第三方评估的重要性,也在评估方法的科学创新方面取得了一些有益的成果,但同时这些研究还未形成统一的理论范式,更未就整体层级政府的大众体育参与工作绩效做出有说服力的理论解释。可见,在这方面的研究还有待更进一步的深化和拓展,其中的一些问题和困惑都有赖于今后对政府全面健身公共服务绩效测评的研究,要在研究中思考和解决。

二 国内相关研究现状

(一)国内政府绩效评估研究现状

随着国家建设“服务型政府”的目标提出之后,推进政府管理创新,深化行政体制改革就成为我国公共管理和公共行政学术界的热点研究问题。作为“政府再造政府再造”及“政府变革”的一种新型治理工具,政府绩效评估激发了我国学者们极大的研究热情,并陆续形成了一系列的研究成果。

1.对国外政府绩效评估理论政府绩效评估理论的引介。政府绩效评估理论政府绩效评估理论兴起于西方学术界,在对西方国家公共部门绩效管理的理论研究和改革实践进行经验总结的基础上,学者们特别注意结合我国政府绩效评估实际,逐渐形成了具有中国特色的政府绩效评估理论政府绩效评估理论体系。蔡立辉通过系统地梳理和分析西方国家政府绩效评估理念的产生和内涵,认为寻求社会公平与民主价值,强调公共责任与顾客至上是西方政府绩效管理始终坚持的核心理念,并提出绩效评估是实现我国政府职能转变、树立服务行政观念和建设数字政府的有效助推工具[34]。刘淑妍和王欢明[35]对国外公共服务绩效评估的价值理念、评价方法以及评价指标三个层面进行了归纳总结,并据此构建出了我国公共服务绩效评价的三维理论模型。还有学者以国别为单位,对西方各发达国家的政府绩效评估理论政府绩效评估理论和评估实践进行剖析。学者孟华[36],陈天祥[37],高小平、贾凌民、吴建南[38],黄良进、肖松[39],谭融、杨淳[40],范春辉[41],就分别从美国政府绩效管理过程中的公众意愿表达、评估理论和实践的历史演进、如何提高政府绩效的实践、绩效评估的法治化进程、评估体系的构建以及政府绩效评估过程中政府和市场以及社会成员之间的关系等不同角度对美国的政府绩效管理进行了研究,并从各自研究角度提出了对我国政府绩效评估理论政府绩效评估理论建设的有益建议。王雁红[42],黄良进、曹立锋[43]以及何晓柯[44]则对英国政府公共部门绩效评价的历史、制度建设和价值取向进行了介绍。此外,学者薛凯则对新西兰公共部门绩效管理进行了研究。

上述学者对于国外先进的政府绩效评估的做法进行深入的探讨和分析,为我国进行政府绩效评估研究提供了最初的方向,为之后我国本土化的政府绩效评估奠定了理论基础。

2.对我国地方政府绩效评估的理论反思。不可否认的是,之前对于国外政府绩效评估的很多研究还停留在简单地概括总结层面或是仅就某项政府的具体工作提出对策建议,而对符合中国行政体制实际的政府绩效评估理论政府绩效评估理论脉络的建构还比较欠缺,对本土经验的理论反思和转化还不够充分。在此之后,学者开始对我国本土化的政府绩效评估的内涵、性质、机制变迁进行更加有益的探索。

首先,徐邦友[45]指出满意原则是行政绩效评价的最终尺度,并分析了政府行政工作满意度评价中的几对重要关系。随后,马玉成[46]从政治哲学角度综合分析了政府绩效评估的研究成果,并概括出当前国内学者对于政府绩效评估的几个共存的基本价值取向——增长、公平、民主、秩序。林琼[47]等从社会转型的角度提出政府职能的合理定位是政府绩效的基本价值选择,认为满足公众需求是政府绩效的根本价值选择,公共服务质量好坏是衡量政府绩效的重要标准,廉洁、高效、公正是政府绩效的价值追求。卓越[48]对公共部门绩效评价的整体过程进行了划分,其中包括建构绩效评价指标体系、设计绩效评价指标的权重系数和等级标准、建立绩效评价和管理机构、确立绩效评价的主体、安排绩效评价的实施程序以及绩效评价结果的运用。之后,彭国甫[49]就政府绩效评价的性质如何界定、政府绩效评价的功能如何定位、政府绩效评价的发展如何把握、政府绩效评价主体如何确定这四个基本问题进行了系统反思。倪星[50]也从制度创新的角度,再次强调了我国政府绩效评估的意义,并从绩效评估的原则、指标的范围、评估的主体等方面进行了分析。上述理论研究成果都为后续我国政府绩效评估的应用研究提供了更有解释力的理论分析框架。

3.政府绩效评估体系构建和应用研究。随着实证性研究浪潮的掀起,国内的学者们已经认识到该领域研究结合我国本土实际的必要性和重要性,开始运用数学和统计学更精确地分析政府绩效评估过程的各种现象和问题。唐任伍[51]结合公共部门绩效评价指标选择思路,设计了一套评估中国省级政府效率的指标体系,它由政府公共服务、公共物品、政府规模、居民经济福利四个因素及其子因素组成,共计47个指标。但是,他所构建的指标体系都是基于政府文件和官方年鉴的“硬指标”筛选和重构的,可能与我国地方政府发展的价值取向脱节。此外,该体系的权重设计仅仅参考了各个因素所含指标的个数及其与政府效率的相关性,并没有给出各个指标与各因素相关性的具体统计学原理,权重确定的合理性和科学性有待进一步加强。李军鹏[52]设计开发了一套适用于评估我国行政环境下政府供给公共产品和公共服务绩效与水平的指标体系,标准分为一般指标和重点指标两个部分,一般指标按照政府公共产品的主要类别分为教育类、社会保障类、公共医疗类、环境保护类、公共科技类等八个大类,由33个具体指标组成;而重点指标由公共教育支出占GDP的比重、社会保障支出占GDP的比重、公共医疗卫生支出占GDP的比重、环境保护投资占GDP的比重、政府公共科技支出总规模以及国防支出占GDP的比重组成。随后他还运用构建的指标体系分析了我国政府公共化水平的实际情况,并与国际主要发达国家进行了对比分析。该指标体系的设计充分考虑了数据的简捷易取性,比较重视指标是否符合国际统计惯例,因此忽略了对主观指标数据的采集和分析。

政府绩效评估的实证研究在继承前人的基础上也在不断发展变化。以王爱学[53]的博士学位论文《公共产品政府供给绩效评估理论与实证分析》为例,他在研究中构建了公共产品政府供给绩效评估理论框架,设计了公共产品政府供给绩效评估指标体系,运用结构方程模型结构方程模型开展对公共产品政府供给绩效的评估;在收集大量统计样本数据基础上,运用结构方程模型结构方程模型实证分析了我国公共科技、公共教育、公共卫生、公共文化、公共设施等具体指标以及由这些指标构成的投入、产出及效果的客观权重。

随后几年中,倪星[54]、陈振明、郑方辉[55]及王俊霞[56]等人在各自研究中达成共识,都将研究重点指向“价值取向”与“指标体系”这两个关键要素,公众评价指标在体系构建的过程中也越来越受到重视。此外,学者们对构建指标体系的科学模型提出了更加严格的要求,纷纷提倡绩效评估的研究必须接受客观的经验事实检验。丰富的既有研究对我国政府绩效评估以及全民健身公共服务绩效评估的实证研究提供了可循的路径。

(二)国内相关公共服务评估实践

为了本研究的进一步开展,结合当前学术界对于公共服务绩效评估模型的主要研究成果,笔者挑选了国内目前公共服务领域比较权威的指数模型进行实践案例分析,力求为本研究提供直接的帮助和借鉴。

第一,公共服务综合绩效指数公共服务综合绩效指数。由国务院发展研究中心宏观部、中国社会科学院数量与技术经济研究所以及特华博士后科研工作站的部分研究人员组成的中国公共服务研究课题组研制了一套衡量我国基本公共服务的绩效指数模型,即公共服务综合绩效指数公共服务综合绩效指数。在2006年中国社会科学出版社推出的《中国公共服务发展报告2006》中首次介绍了该指数的具体研制过程,绩效指数包含8个子系统和165个指标的指标体系,其中8个子系统分别为基础教育、公共卫生、社会保障、科学技术、基础设施、公共安全、环境保护、一般公共服务,运用数据包络分析法数据包络分析法(DEA)对我国公共服务的投入、产出和效果三个方面进行了综合评估。

该指数首次从我国政治体制变迁的角度,将全国整体基本公共服务纳入可统一分析的框架。报告发现,当前政府公共服务整体呈现出“总体水平偏低、发展不平衡、效率低水平趋同”的基本特征,该报告第一次用数据展示了我国公共服务现状,在实践和理论层面都具有一定的开创性。当然,该指数也存在一定的不足,即对公共服务各个部分之间的内在逻辑结构问题没有很好地进行阐述,这也是因为课题组追求指数的“全面性”而无法避免的问题。但是不可否认的是,该指数模型的构建对于本书中全民健身公共服务绩效评估理论模型的构建和之后的实证分析都具有直接的启示意义。

第二,中国城市公共服务指数中国城市公共服务指数。“中国城市公共服务指数中国城市公共服务指数”是由上海交通大学中国服务经济与管理研究中心在2009年编制并推出的。其目的在于为我国各相关城市制定发展战略和相关政策提供依据,进而为我国公共服务的健康、持续发展提供智力支持。研究者采集2006年的统计数据,从产出与支出两个角度,对我国35个城市的公共服务水平进行了分析和比较。该城市公共服务指数内容覆盖了城市基础设施、健康安全、就业社保、科教文化、环境保护五个方面。

在2010年,研究中心沿用了2009年的指数分类,只是在数据与各项具体指标的选取上进行了微调(详见表1-5)[57]。值得借鉴的是,2010年该研究中心对中国35个城市公共服务指数进行排名简要分析后,创新性地运用脸谱图分析方法,将枯燥的公共服务发展水平的数据转变为了更加生动的图文报告。可视化分析方法的运用,拓宽了我国公共服务绩效评估实证分析的思路,改变了以往政府绩效评估“单一面孔”的相同研究路径,这样的研究成果,显然对今后公共服务绩效评估的实践具有创新指导作用,为适应新形势下政府公共服务面向大众、绩效评估走向民主奠定了研究基础。

表1-5 “中国城市公共服务指数中国城市公共服务指数·2010”指标体系

续表

第三,公共文化服务指数公共文化服务指数。该指数由上海师范大学都市文化研究中心、上海高校都市文化E-研究院上海高校都市文化E-研究院在2011年首次编制而成。该指数包含“公共文化投入”“公共文化机构”“公共文化活动”及“公共文化享受”四个一级维度,共38个二级指标。指数运用多元统计分析(Multivariate Statistical Analysis)中比较常用的主成分分析法,对指标各个变量进行适当的组合。在进行主成分分析计算之前,对各个变量的观测数据进行了“中心标准化”处理,使得各个变量都变成了无量纲单位的变量,样本均值都等于0,样本标准差都等于1,保证了公共文化各指数等级排序的合理性。在2012年、2013年,研究中心还不断完善指数体系,在2013年《中国公共文化服务发展报告》中,对“公共文化投入”“公共文化机构”“公共文化产品”“公共文化活动”“公共文化队伍”“公共文化享受”6个一级指标和“文化事业费占财政支出比重”等58个二级指标分析进行排序。

该指数从不同方面反映了各省市自治区公共文化服务的投入状况、规模和服务质量,并对全国31个省市自治区公共文化服务水平的总量与人均进行了排序,对投入与产出绩效进行了排序,较客观合理地反映了全国31个省市自治区的公共文化服务体系建设的现状及其特点。此外,报告还新增了“公共文化服务核心指标分析排序”,从二级指标中选取“人均文化事业费”“每万人公共图书馆建筑面积”等20个核心指标进行分析。该研究中心对于数据信息的深度挖掘,为今后相关领域的公共服务绩效实证分析提供了新的思路。

(三)国内体育领域公共服务绩效评估研究现状

近年来,随着我国经济、社会发展取得巨大成就,居民生活水平不断提高,社会不公平现象也日益突出。当前,在体育领域,尤其是群众体育领域,区域(中东西部)间、地域(城乡)间、体育人口结构上(性别、年龄、受教育程度等)发展的不均衡、不公平的现象依然存在[58]。因此,面对社会公平正义的时代议题,在群众体育资源极化不断加剧的背景下,国内学者基于社会公平正义理念对体育领域公共服务绩效评估的研究也日益增多。为了解国内学术界关于体育领域公共服务绩效评估的研究共识、分歧和不足,笔者对现有文献进行了梳理和总结。

从论文发表的数量看,从2005年到2017年3月20日,在中国知网以“公共体育绩效评估”为主题搜索到的论文为204篇,论文数量虽在不同年份有所波动,但总体来看,依然呈逐年度递增趋势(见图1-1)。特别是2015年,作为国家基本公共服务体系“十二五”规划的收官之年,有关体育领域的公共服务绩效评估研究成果达到顶峰,数量为44篇。可以预测,随着《全民健身计划2016—2020年》和《健康中国健康中国2030规划纲要》的颁布实施,政策文件中对加强体育、卫生、医疗健康等领域的公共服务过程监督以及绩效评估要求的明确,未来“十三五”时期,有关体育领域的公共服务绩效评估研究成果还会继续增加。

图1-1 以“公共体育绩效评估”为主题发表的论文(2005年1月—2017年3月)

从研究主题看,随着西方一般政府公共服务绩效评估理论模型的引入和逐步本土化,国内学者开始借助这些模型分析体育问题,使体育领域的公共服务绩效评估研究很快进入应用层面。目前的研究主要导向三个方面。

第一,体育领域公共财政绩效评估。余平最早运用DEA方法评估分析了2003—2008年间我国体育财政的整体投入效率。随后,邵伟钰[59]选取我国大陆除西藏以外30个省(自治区、直辖市)作为样本,考虑群众体育财政投入产出时滞性,运用数据包络分析方法的CCR、BCC和SE-DEA模型SE-DEA模型对2011年我国地方群众体育财政投入效率进行了分析评价,将群众体育事业支出、群众体育事业支出占体育事业支出比重、社会体育指导员、体育社团、综合运动项目组织数、单项运动项目组织数、体育俱乐部作为研究测量的指标项。郑娟[60]打破了单从群众体育、竞技体育或者体育产业的某一方面衡量财政投入绩效的视阈限制,运用数据包络分析方法整体考察了公共财政支出在全民健身、竞技体育与体育产业的综合表现。

第二,公共体育资源配置绩效评估。唐晓辉[61]等人采用系统分析法以及专家咨询法构建了包含 3个一级指标、7个二级指标、19 个三级指标的城市社区公共体育资源配置的政府绩效评价体系。研究将城市社区公共体育资源配置分为物力、人力、文化资源的配置,最后利用该指标体系对山东省临沂市兰山区某社区公共体育资源配置进行了评价和验证分析。此外,学者们还将关注点放在了对公共体育设施的绩效评价上,张大超[62]等人运用德尔菲法德尔菲法及层次分析法层次分析法等方法,构建了我国公共体育设施发展水平评估指标,其中包括2个一级指标、8个二级指标及47个三级指标。值得肯定的是,该研究借鉴发达国家经验,依据中国国情,对我国体育设施从等级层次、功能及使用方式三个方面进行了分类。依据等级层次,体育设施分为:国家级体育设施;省、自治区及直辖市级体育设施;地市级体育设施;县城级、城市区级、俱乐部级、城市特定区域级体育设施;“城市社区、农村乡镇、自然村”体育设施。这种划分为体育设施的绩效评估提供了新思路。唐立成[63]等人则引入公共体育场馆服务管理绩效评估的概念,探讨了公共体育场馆服务管理的绩效评估的模式及对策,认为公共体育场馆服务管理实施绩效评估的流程包括:设定绩效评估目标;选择评估方法;构建KPI 评估指标体系;实施绩效评估。他还指出要对公共体育场馆服务管理绩效进行全方位的评估,对员工进行评估要从各个角度进行,力图使评估结果客观、全面,角度可以包括员工的上级、下属、服务对象以及被评估人自己等。

第三,体育领域公共服务整体绩效评估。笔者对相关文献进行了搜集、整理和归纳(见表1-6),并按照体育领域公共服务绩效评估研究的发表时间将具有代表性的理论成果列举如下(见表1-7)。

表1-6 国内学者全民健身公共服务绩效评估相关研究文献信息分类

表1-7 国内学者体育领域公共服务绩效评估相关研究概览

续表

续表

通过表1-7列出的近年来我国体育领域公共服务绩效评估的相关文献,可以管窥学术界在该研究领域的动向和特征。

首先,从研究方法上看,体育领域公共服务整体绩效评估对研究规范性的关注越来越多,研究开始在技术、方法和工具上不断创新。除传统德尔菲法德尔菲法、层次分析法层次分析法和平衡积分卡法外,学者们开始采用模糊DEA模型、Tobit模型Tobit模型以及结构方程模型结构方程模型等开展绩效评价。评估方法的日趋多元化、技术化也为评估主体在具体绩效评估实践中提供了更多的选择。这种现象也在一定程度上反映了当前我国体育领域公共服务的供给水平已经成为体育部门决策者以及公众舆论的焦点。绩效评估作为一种高度实践性工作,需要依赖科学的技术和方法来检验体育领域公共服务的规模和质量。

其次,从研究内容上看,学者们开始越来越多地将公众对体育领域公共服务的主观评价纳入到指标体系之中,即以公众满意度指标为代表的感知绩效信息逐渐开始占据重要位置。这是因为一方面,学者们开始意识到随着巨额财政资源向公共体育服务领域投入以及我国群众体育事业的不断改善,公众对体育领域的公共服务的关注早已不再停留于投入统计等冰冷生硬的指标,转而关注与自身运动环境、体育福利等息息相关的微观问题。另一方面,从公共行政学和公共管理学的逻辑视角分析,政府绩效评估本质上就应该是一种主观评价,是公民对于政府提供公共体育服务表现的综合评价,是公众表达体育利益主张和参与地方体育治理的一种重要途径。例如,曹可强[64]等就强调在公共体育服务机构建立内部评价与外部评价相结合的重要性,并认为应该以外部评价为重点,通过对体育主管部门的职能、规划、项目、组织能力、绩效、群众参与度和服务满意度等指标的评估,达到公共体育服务绩效评估的组织执行力和社会公信度。

再次,从绩效评估主体和绩效评估实践来看,第三方评估开始成为体育领域公共服务绩效评价的新常态,这也是体育行政部门创新体育治理的表现。“上海体育学院公共体育服务发展研究中心”作为全国该领域第三方评估机构的主要代表,在2015年如期完成了全国《全民健身计划(2011—2015年)》实施效果的评估工作。其中包括全国各省、各地市、各区县逐级开展《全民健身实施计划》(以下简称《计划》),各级“政府主导”实施《计划》,中央、国务院相关部委、总局系统相关部门“部门协同”实施《计划》,“全社会共同参与”实施《计划》以及社会对《计划》实施的满意度效果评估等多份报告。在实施满意度调查时,中心采用了国外前沿的FIT体育锻炼模型进行分析,并构建了全民健身公共服务满意度评估模型(见图1-2),科学量化的评估手段为我国百姓健身锻炼打下了基础,为我国全民健身的未来发展提供了具有前瞻性、科学性与可操作性的决策支撑。此外,在评估过程中,中心联合国家体育局群体司共同研制了《〈全民健身计划〉实施情况评估标准》[65],其中包括8个一级指标、20个二级指标(主要内容见表1-8)。遗憾的是,该指标体系忽视了体育行政部门工作努力程度、地区差异等因素,并且各个指标没有进行权重系数的确定,在一定程度上影响了后期评估结果的准确性和灵活性。

图1-2 全民健身公众满意度指数体系

表1-8 《全民健身计划》评估核心指标数据汇总

续表

此外,近年来“上海全民健身300指数全民健身300指数”也运用第三方评估的形式,充分发挥科研院校在数据挖掘、评估模型构建方面的优势,在借鉴英国、美国等国家大众体育服务供给和百姓健身需求情况的调查内容、指标体系、调查方式、方法和结果使用等内容的基础上,构建了包含健身环境、运动参与、体质健康发展三项一级指标的全民健身发展指数(见图1-3),每项指数满分均为100分,故又称为“300指数”。该指数包括综合指数、综合指数变化度、单项指数以及单项指数变化度四个评估类型。在此基础上,首次在全国以新闻发布会的形式向社会连续公开发布了《2012年上海市全民健身发展公告》《2013年上海市全民健身发展公告》《2014年上海市全民健身发展公告》以及《2015年上海市全民健身发展公告》。可见,当前第三方机构绩效评估已经成为提高体育行政部门服务绩效和政策落实的利器,它克服了体育行政部门内部评价双重角色的矛盾,能够倾听和回应老百姓有关全民健身的意见和建议,推进体育行政等相关部门更全面地履行社会责任,与社会各方创造合作共赢的公共体育事业的良好局面。

图1-3 上海市全民健身发展指数评价体系

三 相关研究文献述评

目前国内学者在体育领域进行了诸多公共服务绩效评估的探索和实践,取得了丰硕的成果,也积累了一定的经验。但从总体上说,我国在体育领域的公共服务绩效评估工作无论在理论还是在实践上都还不够成熟,尚处在探索起步阶段,还存在不少问题,主要有以下几个方面。

第一,伴随体育领域公共服务绩效评估实践的发展和需要,国内相关绩效评估研究已进行了十余载,每年的著作、论文大量涌现。但是,相关研究经历过雨后春笋般的急速扩张之后,研究普遍存在着一些相似性问题,且缺乏创新思维。我们发现当前的国内学者们似乎陷入了“自说自话”的泥潭,研究者之间对体育领域公共服务绩效评估指标的认同度非常低。此外,这一领域的研究状况参差不齐,能够获得普遍认同的研究范式与体系尚待形成,研究缺少对话与争论。这在一定程度上与国家层面建立起统一的战略规划、绩效计划和绩效报告制度框架有很大关系。

第二,目前在体育领域,公共服务绩效评估模式依然呈现出以结果为导向、注重投入和产出、成本与效益分析的客观测量模式。虽然目前强调满意度调查等软性指标的公众主观评价模式也开始逐渐增多,但所占比例还相对较低,将两种模型相结合的研究更是屈指可数。学术界对于两种评价模式冲突的争论在其他领域已经开始逐渐增多,但是在体育领域还没有针对具体问题进行过探讨。因此,只有通过对二者创新性地合理安排,方能在体育领域公共服务绩效评估理论和实践中取得创新和突破。

第三,现有文献对体育领域公共服务的绩效评估维度很少论及,尽管已有学者开始利用结构方程等模型对体育领域公共服务各要素、各维度的相关关系进行探讨,但由于目前学术界对于我国体育领域的公共服务现象的指称问题还没有达成共识,理论研究中“全民健身公共服务”和“公共体育服务”“体育公共服务”“基本公共体育服务”等相关术语依然存在着严重的混用现象、体育领域公共服务的要素构成尚无公认的权威标准,多数研究还是按照体育领域公共服务的内容分类进行维度划分,仅仅是若干指标的随意堆砌或简单罗列,使得同维度之间、上级指标与下级指标之间的关系往往没有形成一致的逻辑,在一定程度上割裂了维度之间的潜在关系。这不仅加剧了绩效评估的难度,降低了绩效评估的准确度,更直接限制目前我国公共体育事业发展改革的有效性以及理论研究的精准性。

第四,当前我国经济社会发展日新月异,加上“全面建设小康社会”和“健康中国健康中国”建设目标的提出,国家对体育领域公共服务事业的发展赋予了新的时代使命。现今无论是体育领域公共服务的供给方式还是公众对于公共服务质量的预期和感知都发生了前所未有的变化。而现有部分研究所构建的指标体系已经不足以反映当前新形势下体育领域公共服务的现状和特征,因此相应的绩效评估指标也要与时俱进,不断确定新的评价标准并逐步完善,将更多能反映体育领域公共服务改革动态的指标纳入到新的评估体系之中,如当前研究所忽视的体育组织和个人工作绩效指标、地区经济、人口和体育资源禀赋指标、公共服务过程管理绩效指标、公共服务均等化指标、公共服务市场化供给率绩效指标以及公众参与供给公共服务程度等。

第五,从评估方法上看,虽然国内对于体育领域公共服务绩效评估的模型构建和应用研究逐渐增多,但大多还停留在理论研究上,操作性、应用性较差,公众对于绩效评估的辨识性、理解性和关注度都较低,真正被体育主管部门用于公共服务绩效考核的模型还为数不多。除了目前已经运用到的方法外,基于指数的比较绩效测量(comparative performance measurement)的评估模式在体育领域的公共服务绩效评价中还较少使用。全国在体育领域的公共服务工作领域也仅有上海发布了全民健身300指数全民健身300指数公告。因此,学习和借鉴国内外其他领域公共服务指数测量的经验和做法,总结出关于体育领域公共服务绩效指数公共服务绩效指数评估的一般方法,并以“指数”的表达方式反映当前我国体育领域公共服务绩效现状,对于提高现有研究的实用性、可读性有极大的理论和现实意义。诚如学者周志忍所说:“绩效管理研究需要平实的学风,绩效管理研究要立足实践,而且非常有必要推动研究的细化、专门化与深入化。”[66]

综上所述,本书将借鉴国内外学者的研究成果,在重新审视全民健身公共服务的基本内涵和时代特征和清晰把握全民健身公共服务的所涵盖的内容及范畴的前提下,对体育领域影响公共服务绩效的相关因素进行归纳总结,拟构建和开发一套“全民健身公共服务绩效评估模型”,不仅考量实际提供的全民健身公共服务对基本公共体育服务覆盖范围的充分程度,公共体育组织和社会体育组织在关键环节的衔接、配合和主观努力程度,而且还考量实际提供水平相对公众全民健身需求的实现程度。