第二节 中国能源产业空间集聚状况

一 文献综述

产业空间集聚从要素层面看,就是劳动力、资本、知识信息、技术等在空间区域单元内有机汇聚和共生的现象,产业集聚是空间集聚的一种外在表现形式。更宏观的,城市集群、增长极也可以看成各种产业、城市基础设施在一个较大地域范围的集聚。从这个角度看,空间集聚概念就是由要素集聚、产业集聚、城市群这样一个越来越大的集聚综合体组成的,是一个逐渐演化的过程。

经济活动的空间集聚,尤其是产业集聚已有一百多年的研究历史,具有丰富的中外文献资料。本章文献综述分为两部分,第一部分总结产业空间集聚的测量指标,分别从产业集聚和空间关联两个角度归纳;第二部分对产业空间集聚的影响因素进行综述。依据英国经济学家马歇尔(1920)将产业集聚影响因素归结为资源禀赋、资本外部性以及技术外部性,本章将从两条线索对集聚机制进行综述:一是资源禀赋导致的产业空间集聚;二是外部效应导致的产业空间集聚。

1.产业空间集聚的测度研究综述

一般来说,按功用来分,可将产业集聚的空间分析指标大致分为两大类:一类为全局型空间自相关检验(Global Spatial Autocorrelation),另一类为局域型空间自相关检验(Local Spatial Autocorrelation)。

(1)全局空间自相关测量指标

最常用的全局空间自相关统计指标有两个:Moran’s I指数(Moran,1948)以及Geary’s C系数(Geary,1954)。它们衡量的是空间单元某一变量的空间分布状态。

A.全局Moran’s I指数(Global Moran’s I)

Moran于1948年提出了著名的Moran’s I检验,并且构建了Moran’s I检验统计量。Anselin和Kelejian(1997)采用蒙特卡洛模拟实验的方法,进一步研究了在包含内生变量与采用2SLS方法估计的回归模型中,Moran’s I检验的有效样本性质。

Moran’s I指数衡量了空间邻接或空间邻近的观测对象变量数据的相似程度,具体计算公式如下:

img

式中,I代表Moran’s I指数;n为样本容量;wij为衡量区域之间空间贴近度的空间权重矩阵;xi或xj为i点或者j点抑或i区域或者j区域的属性取值;img为所有区域变量的均值;其中,变量方差公式为imgimg

I的取值范围一般为[-1,1],当取值为正时,表示变量分布为正相关,具有正向溢出效应,即高值与高值趋于空间聚集(“高—高”集聚)或者低值与低值趋于空间聚集(“低—低”集聚),越接近1,代表区域之间变量分布关系越紧密,相似性越高;当取值为负时,表示变量分布为负相关,具有反向溢出效应,即高值与低值趋于空间聚集(“高—低”集聚),越接近-1,代表变量之间差距越大;当取值为0时,则代表区域变量分布为空间随机分布不存在空间相关性。

统计量Moran’s I的显著性用Z值来检验,Z值公式如下:

img

根据正态分布临界值检验原理,当小概率事件发生,Z值大于临界值时,拒绝原假设,即空间单元不存在空间正态分布或者随机分布,也就是在相应置信水平下,观测变量存在空间自相关。

B.Geary’s C系数

Geary’s C系数与Moran’s I指数存在负相关关系。Geary’s C系数的具体计算公式为:

img

式中,img为变量的方差。一般来说,Geary’s C系数的取值范围为[0,2]。0<C<1,则变量分布具有正相关性;1<C<2,则变量分布具有负相关性;当C =1时,则表明空间区域的变量不存在空间相关性,即空间单元为空间随机分布。

Geary’s C系数显著性检验形式与Moran’s I的类似,统计量Z值具体公式如下:

img

(2)局域空间自相关测量指标

全局空间自相关是建立在空间同质性假定条件下的,但事实上,局部变量经常表现为空间异质性,因此,发展局域统计方法就成为必要。特别是当全局相关性分析在检测区域内部的空间分布模式存在问题时,局域空间自相关分析就可以弥补它的不足。

A.空间关联局域指标分析(Local Indicators of Spatial Association,LISA)

LISA是由美国ASU教授Luc Anselin于1995年提出的,它是探索性空间数据分析(ESDA)的核心内容。Anselin指出任意一个空间单元的LISA,是衡量该空间单元与显著相似的邻近单元之间空间集聚度的指标。同时LISA的整体加总要与相应的全域空间关联指标成比例(Anselin,1995)。

实际空间关联研究中,尤其是在大样本数据中,全域空间关联非常强且指标显著,但是全域指标很可能难以反映出其局域分布的情况,这时就很有必要用LISA来进一步分析确认空间关联的局域特征。在某些特殊情况下,例如局域的空间关联趋势与全局的截然不同,LISA可以进一步分析空间局域特征。

B.局部Moran’s I指数(local Moran’s I)

局部Moran’s I(Anselin,1995)的统计分析方法,即对于空间上任一观测单元i,有:

img

若为正值,则表示该空间观测单元与邻近单元的属性为正相关关系(“高—高”集聚或者“低—低”集聚);相反,若为负值,则表示该空间观测单元与邻近单元的属性为负相关关系(“高—低”集聚或者“低—高”集聚)。局部Moran’s I指数也是用标准化统计量Z进行显著性检验的。

C.局部Geary’s C指数

由于有时采用全局统计量可能难以揭示出小范围的空间关联关系,Getis和Ord(1992,1995)认为,当全局指标难以显示存在空间自相关性时,建议采用局部G统计量Gi(d)来检测。对于任意一个空间观测单元i,Gi(d)统计量为:

img

其中:img

Gi(d)指数的显著性检验与局部Moran’s I指数相似。当Gi值为正且显著时,表示高观测值的区域单元在该区域单元周围趋于空间集聚(“高—高”集聚)。反之,当Gi值为负且显著时,表示低观测值的区域单元在该区域单元周围趋于空间集聚(“低—低”集聚)。

值得一提的是,Gi统计量具有能够有效地揭示出区域单元属于“高—高”空间集聚模式还是“低—低”空间集聚模式的优势。相较而言,Moran’s I指数只能发现相似值(正相关)或非相似值(负相关)的空间集聚模式。

D.Moran散点图

由(1.2.1)可知:img ,其中img

z代表所有变量与该变量均值的差组成的向量;Wz代表进行标准化后的空间权重矩阵。由上述分析可知,Moran’s I指数即是Wz关于z的线性回归的一种系数表达。

它与局部Moran’s I指数最重要的区别或者说它的优点在于,Moran散点图能够进一步区分出区域单元与其邻近单元之间的具体空间集聚模式,是属于“高—高”集聚、“低—低”集聚、“低—高”集聚抑或是“高—低”集聚,并且由于可视效果,还可识别出每个象限分布着哪几种不同的实体单元。

随着研究的深入,新的测度方法将不断涌现,实际应用中应该有针对性地选择简单而又能达到研究目的的方法,或者多种方法综合运用。

2.产业空间集聚形成机制的研究综述

在集聚机制方面的研究,学者和经济学家们一致认为外部性是产业空间集聚的主要形成机制,而外部性主要表现为资本外部性和技术外部性。由于技术外部性没有形成较为一致的测度指标,测量难度也较高,因此往往被作为“黑箱”处理。而能源作为一种特殊样本,存在着资源禀赋优势,在研究能源产业的空间集聚的集聚机制过程中,必须对资源禀赋这一先天优势的影响因素给予充分的关注。

(1)资源禀赋与产业空间集聚的相关研究

赫克歇尔—俄林理论及新古典贸易理论认为,要素禀赋在一定程度上促进或限制了区域产业发展的可能,在产业集聚的形成过程中,起到一个基础性的作用,可以认为是引发产业集聚的一个重要诱因。1956年,美国经济学家艾萨德(W.Isard)出版了《区位与空间经济学》,试图将屠能的农业区位论与韦伯的工业区位论整合为一个统一的新古典区位论。新古典区位论核心观点在于区域之间地理环境、资源禀赋及市场需求等初始条件的差异是产生空间集聚的根本原因,如自然资源丰富的地方以及大港口附近通常会成为工业集聚的中心地区(如德国的鲁尔地区以及汉堡港等)。这一理论是沿着马歇尔的资源禀赋(natural advantages)路径开展研究工作,由于新古典区位论建立在完全竞争与规模报酬不变的基础上,因此该理论不能解释两个重要的经济现象:第一,一些在纯自然条件方面并不一定非常有优势的地方成为工业集聚的中心;第二,两个自然条件非常相近的地方可能在工业集聚方面具有非常不同的表现。新古典区位理论对上述问题解释的无力,关键原因在于无法将规模报酬递增问题纳入分析框架中。

Ellison和Glaeser研究分析了1987年美国的两位数、三位数和四位数产业在州、县等空间单元的集聚程度,发现几乎所有的产业都表现出了一定程度的集聚态势,而且与自然禀赋高度相关。Brülhart和Trionfètti对欧洲的研究表明要素禀赋对欧洲的经济地理、工业布局影响很大。

借助于D-S模型,克鲁格曼、藤田昌久和维纳布尔斯建立了新经济地理学派,自此对产业分布问题的研究进入空间经济学研究阶段,空间经济学研究开始追随马歇尔的外部效应研究路径。虽然20世纪90年代之后,空间经济学已经成为研究产业空间分布问题的主流范式,但是Kim(1999)和Ellison(1999)等学者的研究却发现资源禀赋仍然是产业空间分布的有力解释工具,很多产业仅仅由于资源禀赋优势就可以形成产业空间集聚。虽然国外对于产业空间分布的理论研究成果非常丰富,但是实证研究工作一直比较滞后,直到20世纪90年代末期,Cainelli等(2004)利用空间经济分析工具对意大利新产业区的产业空间集聚与企业组织形态的关系进行了研究,Thisse(2011)对法国制造业的空间集聚度和影响因素进行了实证研究,发现法国制造业的地区分布具有空间异质性和不均等性。

在国内产业空间分布研究文献中,大多数学者都是沿着新经济地理学的研究路径开展研究工作(范剑勇,2004;金煜、陈钊、陆铭,2006;路江涌、陶志刚,2007)。直到2010年之后,国内学者才逐渐开始关注新古典区位论的研究路径(李超、覃成林,2011),但是目前探索性研究工作都局限在制造业或者服务业领域,而上述产业部门的马歇尔外部性特征比较明显,资源禀赋优势则相对次要,因此在实证检验过程中往往得出资源禀赋因素不显著的结论。

要素禀赋条件对产业空间集聚存在着一定的影响,被称为“第一性先天优势”(first nature advantages)。但随着后现代工业技术的飞速发展,要素禀赋并非是决定某一产业布局的关键因素,在当今经济全球化及一体化的进程中,产业空间集聚的出现并不一定以要素禀赋为导向,“第二性后天优势”(second nature advantages)越来越受到经济学家们的重视,比如外部效应、规模经济、市场需求等。

(2)外部效应与产业空间集聚的相关研究

从国外的研究来看,关于外部效应大体是从集群内部人力资本流动、空间距离、技术锁定、制度和政策等视角进行的。改革开放以来,中国经济活动的空间分布发生了显著变化,产业的地理分布也随之改变,产业地理集聚日益突出。国内学者主要从资本流动、政府角色、企业创新动力等视角研究了产业空间集聚。

①国外相关文献综述

从人力资本流动角度:马歇尔(Marshall,1895)发现知识外溢(knowledge spillovers)是产业空间集聚的重要驱动力,知识大部分被固化在劳动者(特别熟练技能员工)身上。个人在企业间的流动提供了一种信息扩散的途径,企业愿意迁入“信息富裕”的环境,因为企业“扎堆”后,员工间的非正式交流或员工的“跳槽”行为将使各种知识在企业之间传播扩散,人力资本的流动及其再配置过程会产生技术知识溢出(Audretsch,1996)。

从空间距离角度:Freeman认为,地理集中通过信息交易、知识外溢等途径来支持创新发展。Bottazzi和Peri(2003)采用1977—1995年间欧洲86个区域的相关数据实证检验了R&D支出对邻近区域专利活动的影响,分析结果表明,距离R&D源头300公里以内的区域在统计上存在显著的影响,并确认了300公里以外区域不存在技术溢出的效应。由此可见,知识和技术的溢出随距离增加而呈现出衰减的态势。Doring(2006)在研究知识溢出效应时沿用了Griliches的函数形式,依据知识投入和产出的关系来检验区域临近的企业在R&D方面的投入对本地企业在创新产出方面产生的影响。

从技术锁定角度:产业空间集聚也可能面临“技术锁定”的高风险。Venables(1996)认为企业不可能愿意放弃与现存技术连为一体的聚集利益;但这不仅有可能导致核心区域可能延迟新技术的应用过程,而且其集群优势很有可能被边缘区域取代。Krugman(1998)从中心—外围模型的角度研究了集群内的技术锁定问题。Amiti(1998)根据两区域模型分析的结果指出采用新技术的企业将无法享受仍使用现存技术的企业所享有的聚集效应。

②国内相关文献综述

从资本流动角度:国内很多学者看到了人力资本和物质资本在集群区域内流动的重要性。劳动力在企业之间的流动促进了知识在成员企业之间的扩散,并且外部劳动力的流入为外部知识的传入及与集群创新系统内部原有知识的重新融合提供了可能。宁进、于渤(2010)基于长三角地区制造业28个子产业近20年数据,采用结构熵的方法分析了关联产业间技术溢出效应的影响因素,实证结果显示,资本及技术两种影响因素的流动对关联产业间技术溢出效应具有较强影响,而人才因素相对较弱。

从政府角色角度:郑江淮等(2008)从开发区集聚企业功能的视角研究支持企业进驻的溢出效应,认为这种溢出往往是由政府主导的,而且不是内生于企业的空间集聚。王文平、陈娟(2007)认为中国的产业集群受当地产业基础、政府政策、外商投资等因素的影响,其内部的知识共享、技术扩散存在着很大差异。

从创新动力角度:张杰、刘志彪(2007)把中国地方产业集群内微观企业创新动力的集体缺失与升级动力不足归因于集群内模仿—套利行为的普遍盛行。于旭、朱秀梅(2010)对长春市软件产业集群的97家软件企业的调查问卷进行实证分析,构建了技术溢出、吸收能力、企业创新环境与企业创新绩效等变量之间关系的理论模型。研究结果表明,在集群内,技术溢出对企业创新绩效具有直接影响,且两者之间关系受到企业吸收能力和企业创新环境的正向调节作用,另外,企业吸收能力对集群企业间技术溢出具有积极影响。

归纳和总结以往研究文献,发现国内关于外部效应与产业集聚的研究较晚,目前研究的侧重点也大多集中在技术溢出的效应判断、影响因素、溢出路径和效应测量等方面,而把技术溢出与中国产业发展的现实联系起来,得出对中国产业发展有意义的结论的研究明显不足。中国产业集聚的现象越来越明显,产业结构的升级也越来越快,产业发展面临的问题和障碍也越来越多,因此,对理论与现实结合的研究需求也极为迫切,立足中国的产业发展现实,从技术溢出的角度破解中国产业集聚和升级的难题,需要国际化的研究视野,更需要对中国现实的关注。中国产业集聚的主要特征是以政府为主导,“扎堆现象”较为严重,而作为产业集聚核心竞争优势的专业化分工、技术创新等优势并未得到充分体现。

能源产业由于自身产业特点使其成为研究现代产业空间分布的理想样本,一般认为能源产业的上游产业——开采业主要由于资源禀赋优势会形成产业空间集聚,而下游产业——加工业则可能由于规模报酬递增原因形成产业空间集聚(贺灿飞、朱彦刚,2010)。从以上综述可以看出,现阶段关于空间集聚效应的研究,目前国内对于能源产业的空间分布问题及其空间集聚成因的实证研究几乎还是空白。鉴于此,本章首次尝试以我国能源产业为研究样本,利用空间数据分析工具分别通过空间统计分析和空间计量分析,讨论中国能源产业的空间分布状况及其空间集聚效应的影响因素。

二 中国能源产业布局的空间统计分析

为了揭示现象之间的空间联系,在空间分析中引入空间权重矩阵对空间现象之间的相互邻接关系进行定义。数据处理方面,本章在考察能源产业空间分布状况时,参考了Ellison(2010)的研究方法,设立了观察值指标,具体计算方法如下:

img

其中,EIi表示i区域能源产业工业总产值,EI表示全国能源产业工业总产值;TIi表示i区域全行业工业总产值,TI表示全国全行业工业总产值。

本章研究的能源产业主要包括上游产业(石油和天然气开采业、煤炭开采和洗选业)和下游产业(石油加工及炼焦业)。研究数据主要采用2010年的能源相关产业人均产值数据,基于Open Geo DA和Arc GIS10.0空间统计分析软件对变量数据进行空间统计分析。

1.空间等级布局分析

在Arc GIS空间分析软件中录入中国2010年能源产业人均产值的空间地理数据,可以初步得到能源上下游产业的可视化空间等级分布图。

img

图1-2-1 2010年中国煤炭开采和洗选业空间等级分布图

img

图1-2-2 2010年中国石油和天然气开采业的空间等级分布图

img

图1-2-3 2010年中国石油加工及炼焦业空间等级分布图

从图1-2-1可以很清晰地看出,2010年中国煤炭开采和洗选业的空间等级分布情况为:第一等级的省份包括山西、宁夏、河南、北京、山东、陕西和内蒙古,主要是能源富集省区。2010年第二等级的区域包括黑龙江、吉林、安徽、重庆、贵州、青海、四川以及河北省。从图1-2-1中可以粗略地看出煤炭开采和洗选业的空间分布的空间集聚状况比较明显。

从图1-2-2可以看出,2010年中国石油和天然气开采业的空间分布处于第一等级的省份是青海,第二等级有新疆、陕西和黑龙江,第三、四等级涵盖了宁夏、甘肃、四川、贵州、河南、山东等省区。可见,石油和天然气开采业的等级分布同样受到油气资源分布因素的影响。

从图1-2-3可以看出,中国石油加工及炼焦业的空间分布比较分散,但已经逐渐形成的三大集聚区域包括:一是以山东和辽宁为主体的环渤海湾地区;二是以新疆、甘肃为主体的西北地区;三是以广东、海南和福建为主体的珠三角地区。

在对中国能源产业的空间等级分布状况进行初步讨论后,本章将通过测度局部Moran’s I指数和绘制空间集聚LISA图进一步探讨中国能源产业的空间分布状况。

2.空间自相关分析

空间分析过程中,空间因素的引入所涉及最核心的表达就是空间权重矩阵,这也是空间统计分析软件和空间计量模型所需解决的最基本问题。

(1)空间权重矩阵

空间权重矩阵是一种基于拓扑思想的相邻区域和最近相邻单元的主要表达方式。空间关系模型的一般矢量化形式如下:

img

这里,W代表空间贴近度(空间权重矩阵),表示为(n×n)阶矩阵,其中矩阵的对角线元素被设为0。Y代表属性值的相似性。一般来讲,空间权重矩阵的构造必须满足“空间相关性随着‘距离’的增加而减少”的原则。当然,这里的“距离”是广义上的概念,它可以是地理上的距离,也可以是经济意义上合作关系的远近距离,甚至可以表示社会学意义上的人际关系的亲疏距离。

常规的设定空间权重矩阵的方法有两种:分别为基于邻近的方法设定以及基于距离的方法设定。而基于经济社会距离的空间权重矩阵是较为复杂的设定方法。

①基于邻近的空间权重矩阵

也称为简单二进制邻近矩阵,基于邻近的空间权重矩阵Wij的设定公式具体表示为:

img

一般将其分为一阶邻近矩阵和高阶邻近矩阵。一阶邻近矩阵是指空间关联只有在两个区域单元存在共有边界时才会发生,根据这一定义,比如陕西省和甘肃省存在共有的地理边界,那么就可以认为两省是空间邻近的关系,从而赋予1的权重;反之权重赋值为0。高阶邻近矩阵的邻近条件进行了适当地放宽,二阶邻近矩阵还描述了邻近单元的相邻单元的空间信息,即它还能表示一种空间滞后的邻近关系,某地区的空间初始效应或者冲击效应将不仅对其周围地区产生影响,并且随着时间的推移还将对其周围地区的邻近地区产生呈几何递减的影响。

②基于距离的空间权重矩阵

基于距离的空间权重矩阵wij(d)的设定公式为:

img

根据这一定义,权重的设定随区域间的距离dj的定义变化而变化,一般以行政中心所在地间的距离或者质心距离来衡量。当然,这还需要定义一个门槛距离,当地理距离小于给定的门槛距离,则赋值为1,认为存在空间关联效应;若超过给定的门槛距离则赋值为0,认为区域间的空间关联效应可以忽略不计。

③经济社会空间权重矩阵

上述两种设定方法都是使用真实的地理坐标计算地理距离的。除此之外,还有基于经济状态和社会因素的更加复杂的权重矩阵设定方法。例如,根据区域间人均GDP、资本流动、劳动力迁移、贸易往来、交通主干道距离、通信量等方式确定空间权值,计算各个地区任意两个变量之间的距离。为了降低或消除区域间的外在影响,需要把权重矩阵标准化,使得行元素之和为1。

在实际经济研究中,由于(n×n)阶矩阵包含了相应的观测单元之间空间关联的外生信息,故将空间权重矩阵设定为外生变量,因此并不需要通过模型来估计得到。本章采用二进制一阶ROOK邻近(区域的东南西北四个区位有四个邻居)空间权值矩阵对29个省域(不包括西藏、海南、香港、澳门、台湾)的变量数据进行如下空间统计分析及空间计量分析。

(2)中国能源产业全局空间自相关分析

本章分别计算了中国煤炭开采和洗选业、石油和天然气开采业、石油加工及炼焦业2010年的全局Moran’s I指数,分别为0.2728、0.1018和0.0215。从计算结果来看,中国各能源上下游产业的全局Moran’s I指数都大于0,并且标准化检验值Z均为正且都大于1.96,概率P值也都小于0.05,这说明中国能源产业的空间布局存在显著的空间集聚。

同时,从中国能源产业各组成部分来看,煤炭开采和洗选业的空间集聚度最高,石油和天然气开采业的空间集聚度次之,石油加工及炼焦业的空间集聚度最小。由此初步分析可以得出,中国能源产业上游呈现强空间集聚状况,而下游却呈现弱空间集聚状况,上下游之间的空间集聚度并不匹配。

(3)中国能源产业局域空间自相关分析

从全局Moran’s I指数的分析中发现,中国能源产业的空间布局整体上已经呈现出空间集聚状态,但是国内哪些区域的能源产业空间集聚程度较高,哪些区域对全局空间集聚的贡献更大,就需要进一步对能源产业进行局部空间自相关分析,本章采用了可视化的空间集聚LISA图以及Moran散点图来进行相关探讨。

①煤炭采选业局域空间自相关分析

根据局部Moran’s I指数公式计算得出,指数为正的省域依次为山西、内蒙古、陕西、天津、宁夏、北京、山东、河南,这与图1-2-1煤炭产业空间分布等级图显示结果相同。图1-2-4为2010年中国煤炭开采和洗选业的Moran散点图,从中我们可以直观地看出,绝大部分省份位于第三象限,为“低—低”集聚型,第一象限“高—高”集聚型的省份个数次之,而这种分布规律主要与资源禀赋的优势条件有关。并且Moran’s I指数值为0.2728,表明存在正向空间依赖性,邻近区域的属性值相近,具有明显的空间集聚形态。

根据空间集聚LISA分析(见图1-2-5)可以发现,2010年中国煤炭开采和洗选业内蒙古、陕西以及山西省为“高—高”集聚区,福建、江西、湖南为“低—低”集聚区,河北省则为“低—高”集聚区。由此空间集聚态势可以清晰地看出,我国煤炭开采和洗选业空间集聚显著。

img

图1-2-4 2010年中国煤炭开采和洗选业的Moran散点图

img

图1-2-5 2010年中国煤炭开采和洗选业空间集聚LISA图

②石油和天然气开采业局域空间自相关分析

根据中国能源产业局部Moran’s I指数(图1-2-6),中国各省石油和天然气开采业的空间集聚状态差异性较大,第一象限“高—高”集聚省份仅有三个,第三象限“低—低”集聚省份分布最多,但在整体空间分布上表现出正向的空间依赖性,人均产值相似的省份仍然在地理上区域相近,全局Moran’s I指数为0.1018。

img

图1-2-6 2010年中国石油和天然气开采业的Moran散点图

通过空间集聚LISA分析(图1-2-7)可知,中国石油和天然气开采业的空间布局中,青海、甘肃表现为显著的“高—高”集聚,广东和浙江省表现为显著的“低—低”集聚,并且LISA的显著性检验显示都通过5%的检验,而其他省份空间集聚并不显著。

img

图1-2-7 2010年中国石油和天然气开采业空间集聚LISA图

(4)石油加工及炼焦业的局域空间自相关分析

从图1-2-8石油加工及炼焦业局部Moran’s I指数分析可知,中国各省石油加工及炼焦业的局部Moran’s I指数非常接近,只有一两个奇异值。并且集中分布在第二和第三象限,分布表现出“高—低”和“低—低”空间集聚,“高—高”集聚的省份仅有三个,而且分布位非常低,全局Moran’s I指数仅为0.0215,中国石油加工及炼焦业目前空间分布的集聚形态在统计上并不显著。

img

图1-2-8 2010年中国石油加工及炼焦业的Moran散点图

从2010年中国石油加工及炼焦业空间集聚LISA分析(见图1-2-9)看出,目前中国没有出现石油加工及炼焦业显著的“高—高”集聚的区域,却存在多个“低—高”集聚的省份:四川、贵州、重庆和云南等。这同样表明中国石油加工及炼焦业并没有出现空间集聚区域,省域之间的产业割裂及重复建设状况比较严重。

三 中国能源产业空间布局影响因素的实证分析

1.空间计量分析工具综述

空间计量经济学是由地学科学和计量经济学共同发展而来的一个新兴的研究领域,最近二三十年,随着计算技术和计算机模拟技术的发展以及一大批专家学者如Anselin、Bruecckner、Kelejian、Haining和Case等的不懈努力,空间计量经济学取得了突飞猛进的发展。

img

图1-2-9 2010年中国石油加工及炼焦业空间集聚LISA图

Anselin(1988)认为,空间计量经济学是指在空间效应进行恰当设定的基础上,对区域经济回归模型进行相应的模型设定、回归估计、分析检验与经济预测的计量经济学方法。当然,空间计量并不是将先前的经典技术全然摒弃,而是在此基础上加以改进使其能够适用于空间数据分析。空间计量经济学主要是解决空间自相关的问题。

空间自相关来自两个方面:第一,同一变量取自不同地区,在样本数据采集时可能存在空间上的测量误差;第二,相邻地区间会存在某些客观联系,从而这种空间自相关性在空间自回归模型中体现在误差项和因变量的滞后项。在空间计量经济学中,主要是运用两种主流的空间计量模型——空间滞后模型(Spatial Lag Model,SLM)与空间误差模型(Spatial Error Model,SEM)来处理空间自相关问题(Anselin,2000)。

(1)空间滞后模型(SLM)

SLM表示某一地区经济增长的所有解释变量,都会通过空间传导机制作用于其他地区。也称空间自回归模型,形式上表示为:

img

其中:X为n×k阶外生解释变量矩阵;Y为n×1阶因变量向量;ρ为空间自回归系数,反映了相邻地区对本地区空间依赖程度和影响方向;w为n×n阶的空间权重矩阵;wy为空间滞后变量,测量了空间因素对区域经济的影响;ε是误差项向量。这与同类型的时间序列模型关于自变量与随机误差项不相关的基本假设不同,其空间滞后项wy与误差项ε是相关的,即ε与自变量是独立同分布非随机的。由上式的简化型可以得出:

img

因此,当存在空间自相关问题时,就使得我们经常使用的经典OLS回归估计的结果也不再是最优解,即不再有效或无偏。

(2)空间误差模型(SEM)

SEM描述的是区域溢出效应是随机冲击的结果。其考虑了误差项对其他地区经济增长的空间效应,表达式为:

img

其中:β为回归系数,表示自变量X对因变量Y的影响;ε为随机误差项向量;λ为空间误差系数,描述了样本观测单元之间的空间依赖作用;μ为随机误差向量,满足方差固定且不相关并服从正态分布的假设。

可见,空间误差模型是由标准回归模型与误差项ε的空间自回归模型组合而成的,是误差项具有空间相关性的一种回归特例。它与空间滞后模型的主要区别是,空间误差模型描述了空间样本观测单元的随机误差项之间存在着空间自相关,是由于因变量的随机冲击造成的区域溢出效应。

2.能源产业空间布局影响因素模型构建

(1)基本模型的构建

假设能源产业包括n个企业,第k个企业在区域M内选址i的决策为vki,其获得的最大利润为πki。该企业的利润最大化方程为:

img

其中,img反映产业内的典型企业选址i的盈利能力,εki是随机扰动项,g(v1,i,v2,i,…,vk-1,i)反映先前选址在区域i的企业对典型企业产生的外部效应。由于存在外部效应,因此一企业在区位选择时,靠近某一些企业的收益要高于靠近另一些企业的收益,并且超出的收益会随邻近程度平滑变动。为了使模型易于处理,假定外部效应的收益是“全有或全无”,即两个企业之间产生的外部效应的潜在收益或者全部收获,或者完全没有得到。

在模型中,资源禀赋对利润的影响是通过随机变量img体现的,因此该随机变量的数学期望反映了选址在区域i的平均盈利能力,方差反映了盈利对区位i选择的敏感程度。例如,若一个区域蕴含丰富的油气资源,则该区域对石油天然气开采业盈利的影响程度就很高,但是对煤炭开采业的盈利影响则很低。

假设外部效应为γβ,此时的能源产业空间分布模型为:

img

其中,φkl是服从伯努利分布的随机变量,用来衡量区域内外部效应的潜在收益,其概率分布与γβ相同。uli代表企业l选择了区域i,假定企业间的外部效应是对称的,即φlk=1⇒φkl=1。

假定用si表示区域i的工业总产值份额,xi表示区域i能源企业产值份额,因此能源产业的空间集聚度公式为imgzk是第k个产业的产出份额,uki是指示变量,当uki=1时,表明产业k的生产全部集中到区域i。

由于G的预期值与先天优势变量和外部效应变量相关联,因此考虑外部效应条件下,能源产业空间分布模型变形如下:

img

其中,img是能源产业区域分布的赫芬达尔指数,且γ=γα+ γβαγβ。因此,能源产业的空间分布E(G)主要受先天优势γα以及外部效应γβ的影响。[1]

(2)基本模型的拓展

根据上述理论模型的推导,能源产业空间分布受到区域资源禀赋和外部效应的影响。因此,根据空间经济学理论,我们将专业化工人的集聚、中间产品的汇聚以及技术溢出效应引入计量模型之中,用来考察马歇尔外部性对能源产业空间分布的影响,同时将资源禀赋、市场潜能和经济政策变量也引入计量模型中。据此,本章设定能源产业空间分布的空间滞后计量模型(SLM)为:

img

空间误差模型(SEM)为:

img

其中,被解释变量Ii表示中国各省市自治区的能源产业空间Moran’s I指数,数值为正且越大,表明能源产业在该省的空间集聚程度越高;w为0—1分布的基于邻近的空间权重矩阵;RE代表人均资源储量水平,该值越大表明该省资源禀赋越高;MP代表市场潜能;IP、HP和IRD分别代表中间投入品的汇聚水平、专业化工人的集聚水平以及技术溢出水平;G代表政府经济政策;ε为随机误差项。

(3)模型变量及数据来源

①资源禀赋

新古典区位理论认为资源密集型产业的地理分布依赖于资源禀赋,为了使运输成本最小化,资源密集型产业大多布局在资源富集地区(Ohlin,1957)。基于资源禀赋度量指标的内生性问题(方颖,2011),本章选取区域内能源储量占当地人口数比例来反映区域资源禀赋。以当地人口总数作为分母,而不是以工业总产值为分母,能够有效避免错置资源丰裕度的问题(Alexeev和Conrad,2009)。

②市场潜能

借鉴Harris(2004)方法,市场潜能函数(Market Potential Function)用其他地区能源产品最终需求的加权平均数来衡量某地的能源产业市场潜能,其权数是区域间距离的减函数。具体计算公式如下:

img

其中,img表示区域L的能源产业市场潜能,Yi是i地区对能源产品的最终消费水平,DiL是地区i到L的距离。本章以省会距离为准来衡量两省之间的距离。那么,DiL为i、L两地区省会城市间的距离;DLL为L地区内部距离。借鉴Redding和Venables(2004)的研究成果,各地区内部距离取地理半径的2/3,即img,其中AreaL为L省的地区土地面积。

③外部效应

a.中间投入品的汇聚。基于Amiti-Javorcik(2008)的方法以及赵曌等(2012)的改进,本章的中间产品投入汇聚指标img的计算公式为:

img

式中,img表示L省能源产业i的中间产品供给产业的空间基尼系数,img表示L省i产业的工业总产值,img表示全国i产业的工业总产值,img表示L省的全部行业的工业总产值之和,img表示全国全部行业的工业总产值之和。由于这一指标消除了省区间的规模效应,因此该值越大,表示中间产业制造产业i对本省J行业的供给能力越大;aij表示产业i与能源产业J之间的投入产出关系。[2]img值越大,说明L省中间产品行业空间集聚度越大;反之则表示中间产品行业空间集聚度越小。

b.专业化工人的集聚。基于Ellison-Glaeser指数构建方法,本章构建出专业化工人集聚度指标img,其具体计算公式为:

img

式中,Hj表示能源产业劳动力地理集中度,用赫芬达尔指数表示,公式为img,其中Si为第i个地区能源产业劳动力人数占全国能源产业劳动力人数的比例。wi是权重,其中Ti为地区i能源产业L的工业总产值。img表示i地区地理单元大小所占的比例。img越大表示L省能源产业劳动力的集聚程度越高。

c.技术溢出

目前主流的产业间技术溢出测度方法采用的是“间接R&D”测度方法(潘文卿,2011),其计算公式为:

img

其中,RDi表示第i产业直接的R&D投入,权数ωij表示第i产业的技术投入有多大比例溢出到能源产业,ωij的确定参照胡健等(2010)的技术距离法来确定。

④经济政策

由于国家政策引导对能源产业发展至关重要,因此本章构建经济政策虚拟变量G来衡量政策因素的影响。当某省区建立了国家级或省级的能源重化工基地,则虚拟变量G赋值为1;反之,则赋值为0。

本书采用的数据中资源、经济以及人口类数据来自能源统计年鉴,各省统计年鉴以及中国统计年鉴,各省各产业的R&D投入数据来自于各省第二次经济普查公告,各省会城市间的距离以及省域内部距离数据是根据国家测绘局公布的国家基础地理信息系统中1∶400万中国地形数据库整理得到的,采用的是欧氏直线距离。

3.能源产业空间布局影响因素的实证检验

当确定模型存在空间自相关问题则需判定SLM和SEM哪个更适用,拟合效果更佳,这就需要运用四个拉格朗日乘数(Lagrange Multiplier)指标,即LM(error)检验、稳健的(Robust)LM(error)检验以及LM (lag)、稳健的(Robust)LM(lag)检验。

Anselin和Florax(2005)提出了如下空间计量模型回归决策步骤:基于OLS回归关于空间自相关检验的结果,若LM(lag)比LM(error)在统计上更加显著,则空间滞后模型比空间误差模型更适用;若两者都不显著,则根据稳健的LM(lag)和稳健的LM(error)进一步进行判定;若稳健的LM(lag)较LM(error)更显著,则可以判定空间滞后模型为最佳选择;反之,如果LM(error)比LM(lag)在统计上更加显著,或者两者都不显著但稳健的LM(error)显著而稳健的LM(lag)不显著,则可以判定最佳模型为空间误差模型。当模型存在空间滞后型或者空间误差型的局部设定偏误时,稳健的LM检验比LM检验更加可靠。

空间计量模型的显著性检验常用的检验指标有:赤池信息准则(Akaike Information Criterion,AIC)、施瓦茨信息准则(Schwartz Criterion,SC)、自然对数似然值(Log Likelihood,LogL)、似然比检验(Likelihood Ratio,LR)。AIC和SC值越小,对数似然值越大,模型拟合效果越好。需要注意的是拟合优度R2对空间计量模型显著性的检验已不再有效。

在本章实证检验中,首先通过Open Geo DA软件对模型进行最小二乘法(OLS)回归估计,通过Moran’s I指数判别变量之间是否存在空间自相关关系,然后根据四个拉格朗日乘数指标判定选择究竟是采用空间误差模型(SEM)还是空间滞后模型(SLM)进行实证检验;接着,本章基于上述空间计量模型的选择结果进行相应的空间计量分析;最后根据模型的回归结果给出相应的分析解释。

(1)煤炭产业空间布局影响因素的实证分析

a.常规的OLS估计结果分析

为了与能源产业空间集聚分布的空间计量经济分析的结果做比较,以下首先对中国煤炭产业的空间集聚分布影响因素进行常规的普通最小二乘法OLS回归估计,结果如表1-2-1所示:

表1-2-1 OLS回归估计结果

img

从表1-2-1可以看出OLS估计模型的拟合优度R2为0.4292,F值为3.38384,模型整体上通过了1%的显著性水平检验。根据多重共线性条件数(multicollinearity condition number),非正态检验(Jarque-Bera)以及异方差性检验(Breusch-Pagan)的回归诊断结果,显示出了相当大的非正态性和异方差性,以及高度空间自相关性(P = 0.0837)。因为在回归分析中的许多属性渐近均匀分布,没有假设正态,非正态性并不是个太严重的问题。实际上,前面对变量进行的Moran’s I指数检验表明,中国煤炭产业具有明显的空间自相关性。回归系数除了经济政策变量G显示为正且显著,其他变量在统计上都不显著,这与原本的基本认识不一致。并且,由表1-2-1 Moran’s I(error)统计量可知,该模型存在显著的空间自相关问题,模型设定忽视了截面单元(省域)之间的空间相关性,这可能是导致估计结果与基本认识不尽一致的根本原因。

同时,表1-2-1中OLS估计的LM(lag)和Robust LM(lag)相伴概率分别为0.4470和0.1157,统计不显著;而LM(error)和Robust LM (error)的相伴概率分别为0.0526和0.0174,在1%水平上统计显著,因此根据空间依赖性检验结果可初步判定SEM模型要优于SLM模型,空间误差模型是一个很合适的替代。

b.SLM和SEM估计结果分析

基于Arc GIS及Open Geo DA空间分析软件,运用极大似然估计(MLE)方法对煤炭产业空间集聚分布影响因素的空间计量模型进行回归,表1-2-2和表1-2-3分别列出了空间滞后模型(SLM)和空间误差模型(SEM)的估计结果。

表1-2-2 SLM模型MLE估计结果

img

续表

img

值得一提的是,MLE估计结果中列出的R2是一个伪R2,与OLS回归结果中所给出的R2统计量无法直接对比,一般采用对数似然函数值(log-likelihood),赤池信息准则(AIC)和施瓦茨信息准则(SC)等统计指标来替代拟合优度。我们注意到,SEM模型中log-likelihood从-35.6463上升到-34.4514,为补偿增加变量(空间误差项)后提高的拟合度,AIC值(从83.2926到82.9027),SC值(从93.9771到93.5872)都相对于OLS模型有所降低,又一次表明空间误差模型拟合优度的提高。空间自回归系数λ 为-2.3685,高度显著(P =0.0000)。

表1-2-3 SEM的MLE估计结果

img

注:“LAMBDA”即λ,为n×1的截面被解释变量向量的空间自回归误差系数。

综合表1-2-1、表1-2-2和表1-2-3中的检验结果可知,SEM的拟合优度检验值均高于SLM模型和OLS模型。并且,SEM模型中MLE回归结果中,异方差性的Breusch-Pagan检验(P =0.7285)显示在空间误差模型中已经消除了异方差性问题,关于空间自回归系数的likelihood ratio检验(P =0.0008)也说明了空间误差系数的高度显著。最后断定,SEM模型较之SLM和OLS模型更好。

依据表1-2-3可得煤炭产业空间误差模型为:

img

由公式可知,先天优势中的资源禀赋因素RE和市场潜能因素MP对煤炭产业空间分布的影响系数分别为0.1140和0.8105,都通过显著性水平为1%的检验,由此可以看出资源禀赋优势与市场潜能优势是煤炭产业空间分布非常重要的影响因素。外部效应中的中间产品汇聚(IP)和技术溢出(IRD)对煤炭产业空间分布的影响都是负的,分别是-1.1197和-0.5063,只有专业化劳动力的集中(HP)的影响是0.0694。经济政策影响因素(G)对煤炭产业空间分布的影响系数为0.8165,通过了显著水平为1%的检验。

由此可以看出,目前中国煤炭产业空间分布主要还是受先天优势以及政府经济政策的影响,而外部效应因素的影响不显著,其中中间产品集聚和技术溢出与煤炭产业的空间集聚还是负相关。

(2)石油天然气产业空间布局影响因素的实证分析

a.常规的OLS估计结果分析

同理,首先对中国石油天然气产业的空间集聚分布影响因素模型进行OLS回归检验,结果如表1-2-4所示:

表1-2-4 OLS估计结果

img

续表

img

从表1-2-4可以看出OLS估计模型的拟合优度R2为0.4232,F值为3.3021,模型整体上通过了1%的显著性水平检验。根据多重共线性条件数(multicollinearity condition number),非正态检验(Jarque-Bera)以及异方差性检验(Breusch-Pagan)的回归诊断结果,显示出了相当大的非正态性和异方差性,并且,由Moran’s I(error)统计量可知,变量之间存在高度空间自相关性(P =0.0013)。同理可知,该模型的设定忽视了截面单元(省域)之间的空间相关性,导致了回归结果与基本认识不尽一致。

同时,表1-2-4中OLS估计的LM(lag)和Robust LM(lag)相伴概率分别为0.3320、0.1341,统计上并不显著;而LM(error)和Robust LM(error)的相伴概率分别为0.0397和0.0187,都在5%水平上显著通过拉格朗日乘数检验,因此根据空间依赖性检验结果可初步判定SEM模型要优于SLM模型,空间误差模型是一个很合适的替代。

b.SLM和SEM估计结果分析

通过运用极大似然估计(MLE)分布对石油天然气产业空间集聚分布影响因素的空间计量模型进行回归,表1-2-5和表1-2-6分别列出了空间滞后模型(SLM)和空间误差模型(SEM)的估计结果。

表1-2-5 SLM的MLE估计结果

img

表1-2-6 SEM的MLE估计结果

img

结合表1-2-5和表1-2-6可知,SEM模型中log-likelihood 从-35.7927上升到-33.6598,为补偿增加变量(空间误差项)后提高的拟合度,AIC值(从87.5855到81.3195),SC值(从99.7963 到92.0041)都相对于OLS模型有所降低,又一次表明空间误差模型拟合优度的提高。空间自回归系数λ为0.5950,高度显著(P = 0.0001)。

综合表1-2-4、表1-2-5和表1-2-6中的检验结果可知,SEM的拟合优度检验值均高于SLM模型和OLS模型。并且,SEM模型中MLE回归结果中,异方差性的Breusch-Pagan检验(P = 0.000)显示在空间误差模型中已经消除了异方差性问题,关于空间自回归系数的likelihood ratio检验(P =0.0128)也说明了空间误差系数的高度显著。最后断定,SEM模型较之SLM和OLS模型更好。

依据表1-2-6可得石油天然气产业空间误差模型为:

img

根据回归公式可知,先天优势中的资源禀赋因素RE和市场潜能因素MP对石油天然气产业空间分布的影响系数分别为0.04566和-0.1989,都通过显著性水平为1%的检验,由此可以看出资源禀赋对石油天然气产业空间分布的影响要远远高于煤炭产业,同时市场潜能因素对石油天然气产业空间分布的影响则为负。外部效应中的中间产品汇聚(IP)、专业化劳动力的集中(HP)和技术溢出(IRD)对石油天然气产业空间分布的影响系数分别是0.1609、0.1917和0.0682,且都通过了显著水平为1%的检验。由此可以看出,外部效应对石油天然气产业的空间分布影响是异常重要的,石油天然气产业空间集聚可以产生显著的空间溢出效应,从而形成累计循环效应。经济政策影响因素(G)对石油天然气产业空间分布的影响系数为1.5677,并通过了显著水平为1%的检验。由影响系数可以看出经济政策是所有因素中对石油天然气产业空间分布影响最大的因素,因此政府科学经济政策的引导对于石油天然气产业空间集聚的形成至关重要。