第三节 房地产价格预测模型

房地产价格预测模型包括纯粹时间序列模型、结构式模型和基于先行指标的模型等,这些模型都有各自的优缺点。

一 时间序列模型

建立基于纯粹时间序列数据的模型的方法包括ARIMA模型和VAR模型等。在韩国,以纯粹时间序列模型来预测房地产价格的研究也没有突破国外研究中设定的范围。

1.ARIMA模型

假设对xt进行d次差分得到的变数yt=(1-Ldxt是一个平稳的时间序列,t期的误差项为εt,那么xtARIMAp, d, q)模型如下。这里的L是滞后算子,Lkxt=xt-k

ρLytLεt

其中,ρL=1-ρ1L-ρ2L2-pLp, θL=1+θ1L+θ2L2++θqpLq。可利用ρL)和θL)的推算结果求预测值,ARIMA模型必须要以平稳的时间序列为对象建立。由此可知,在发生亚洲金融危机等外部经济环境急剧动荡,或房地产政策出现根本性变化等情况时,时间序列本身发生根本性的变化,预测能力会急剧下降。

采用ARIMA模型进行实证分析的例子包括以公寓买卖和传贳“传贳”是韩国特有的房产物权制度,是非常普遍的一种租房方式。房客在签约入住时交给房东一定额度的押金(传贳金),合同期满后,房东则将全部传贳金返还给租户。传贳合同一般两年有效,双方可以协议续签。在合同有效期内,房客无须再向房东交任何房租,即获得房屋的使用权。——译者注价格为数据进行的研究,以及以住房买卖和传贳价格为分析数据进行的研究。研究结果显示,ARIMA模型比状态空间模型和传递函数模型的预测能力低。这一结果,在房地产政策对房地产市场影响较大的韩国住房市场环境下,是显而易见的。

2.VAR模型

VAR模型基本上呈以内生变量的前期值和外生变量来解释几个内生变量的形态。假设yt表示以t期的k个内生变量观测值构成的(k×1)维向量,xt表示t期的d个外生变量观测值构成的(d×1)维向量,(k×k)维矩Ai是内生变量相关的系数矩阵,(d×d)维矩阵B为外生变量相关的系数矩阵,εt是( 1)维随机误差向量,则VAR模型可以用下式表示。

yt=A1yt-1+A2yt-2++Apyt-p+Bxtt

在该模型中要估算A1, …, ApB,估算结果因K个内生变量如何排序、滞后阶数p如何取值等而不同。为了使推算过程的随意性最小化,先进行Granger-Sims因果关系检验,利用检验结果来决定内生变量的顺序,也可采用赤池(Akaike)信息、施瓦茨(Schwartz)等准则来确定恰当的滞后阶数。但是,我们依然难以否认即便进行这样的检验过程,也无法完全排除随意性。

以VAR模型计算A1, …, ApB时,可利用内生变量的前期值yt-1, yt-2, …, yt-p和外生变量xt的预测值来求yt的预测值。为了评估预测值是否适当,一般可以通过不在样本期间的、可以利用的期间之外(out of sample)的预测值而求得的均方根误差(Root Mean Square Error, RMSE)值等来求解。

除了用于预测,VAR模型的推算结果也用于判断变量的性质,为此,可采用方差分解分析和脉冲响应分析等。方差分解是将系统中每个内生变量的波动(K步预测均方误差)按其成因进行分解,分析每一结构对内生变量变化的贡献度。脉冲响应函数描述的是VAR模型中的误差项发生变化时给其他内生变量所带来的动态影响。

以VAR模型对韩国房地产市场进行分析的研究包括:李周用(1992),徐昇焕(1993),姜元喆、金福顺(1997),金甲星、徐昇焕(1999)、Kim Ilkwon(1999),尹珠贤(2001), Son Jeongsik、金宽永、Kim Yongsun(2002)等。徐昇焕(1993)采用住房价格变动率、土地价格变动率、消费者物价变动率、通货膨胀率、矿工业工资上升率、股价变动率等建立VAR模型。姜元喆、金福顺(1997)则采用了土地价格变动率、货币供应量、人均GDP、利率、汇率等。徐昇焕、金甲星(1999)采用实际GDP增长率、股价变动率、利率变动率、GDP平减指数上升率、矿工业工资上升率、货币供应量(M3)的变动率、建筑许可面积变化率等。而Son Jeongsik、金宽永、Kim Yongsun(2002)等则采用土地价格、住房买卖和传贳价格、实际GDP、货币供应量、消费者物价、股指、利率、对美元的汇率、失业率、建筑许可、建筑投资、土地交易等数据。

一般来说,VAR模型的预测误差比ARIMA模型小,预测能力更佳。进行脉冲响应分析时,受到脉冲的响应方向基本上与理论一致。也就是说,调息时房地产价格上升率下跌,股价、经济增长率等上升时,房地产价格上升率也上升。此外,从长期看,冲击的影响一般呈现收敛形态。采用方差分析研究中,徐昇焕、金甲星(1999)的结果显示,土地价格、住房买卖价格、住房传贳价格能解释资产和房地产价格变动的大部分方差,而实际GDP、股价、利率等的解释力则很弱。

有的研究结果也显示,住房买卖价格和住房传贳价格能解释大部分自身的变化,但是土地价格和实际GDP对地价变动率的解释力相似。然而,我们可以推测,这是没有将住房买卖价格等相关房地产价格包括在VAR模型内的结果。

一般而言,VAR模型的预测能力比ARIMA模型强,但是不如结构式模型或包括先行指标的结构式模型。此外,即使事先知道政策的变化也无法反映到预测中去,因此像韩国这样受政策影响大的房地产市场,采用纯粹时间序列模型来预测存在根本上的局限性。

二 结构式模型

结构式模型包括基于Hedonic价格模型的模型、回归分析模型和宏观计量模型的模型。这些结构式模型中采用的解释变量有雇佣水平、预期通货膨胀率、收入、人口和按揭贷款(Mortgage)支付额等,这些解释变量中考虑的中长期解释因素主要是人口。有些极端观点认为,目前的成年人口会影响今后20年间的住房价格变动,但是对此仍有争议。

结构式模型包括回归分析模型和宏观计量模型。在韩国学界,基于结构式模型的研究中有仅由几个回归方程建成的小规模模型,也有由100多个结构方程式和恒等式组成的中等规模的宏观计量模型。但是不管哪种模型,都共同将有理论依据的宏观经济变量作为房地产价格的解释变量。利用构建的结构式模型,可以基于外生变量的预测值来预测房地产的价格,也可以进行模拟实验(Simulation),把握外生变量的变动引起的房地产价格波动的方向和程度。

各个模型中使用的变量如下:金宽永、Choe Beomsu采用了住房投资、住房买卖价格上升率、民营住房资金贷款、国民住房基金贷款、消费者物价指数等。孙炅焕、金惠承则采用收入、货币供应量、住房建设工程费用指数、宅地供应量、住房建设量、住房买卖价格指数、住房传贳价格指数、住房资金贷款、住房投资等。徐昇焕使用的变量包括土地价格、住房买卖价格、住房传贳价格、股价、货币供应量、建筑许可、住房投资、GDP、消费、汇率、出口、进口、利率、物价、失业率等。

房地产市场主要通过房地产价格变动影响国民经济,同时也受到国民经济的影响。房地产价格上升通过财富效应引起消费的增加,房地产价格上升会使担保价值上升从而促进投资。而作为生产要素的房地产价格上升时,要素投入量减少,从而也可能引起投资的减少。房地产价格的上升推动一般物价上升时,出口减少,进口增加,经常收支恶化。房地产价格变动引起的收入变化会引起房地产需求的变化,从而再次影响房地产价格的变动。也就是说,房地产市场和国民经济其他部门的关系可以构建起联立方程式。

完成结构式模型的建立和推算之后,利用其结果可以进行政策模拟实验,外生变量也可以取一个适当的值对未来进行预测。但进行预测时,如何引进外生变量、调整常数项是个问题。一般而言,大部分只依靠ARIMA模型等来决定外生变量预测值,但是对于受政策影响大的外生变量以这种方法预测取值存在局限性,而且对于联立方程形式的宏观计量模型,调整具有一定大小的常数项是个问题。

三 基于先行指标的模型

这种模型是构建先行于房地产周期波动的指标来进行预测的方法。构建先行指标的方法主要包括:NBER景气指数法、主成分分析(Principal Component Analysis)和利用Stock-Watson型景气指数等。

利用NBER景气指数法、主成分分析的概念如下:假设LIt是房地产价格变化率PtK阶数的先行指标,则Pt=α+∑kβkLIt-k成立,而LIt是以几个先行性指标Xtm构建而成的,因而LIt=∑mγmXtm成立。在这种情况下,为了求得γm,可以采用NBER景气指数法或主成分分析等,求得γm之后,在t时点上,Xt-1, m, …, Xt-k, m值可知,所以也可以求得LIt-1, …, LIt-k的值,因此就可以通过Pt+∑kβkLIt-k来预测Pt

利用主成分分析法求解γi的值,并以此来求得先行指标和LIt的方法(t=1, 2, …, T)为:假设Xtm是影响t期的LIt的第m个因素的值(t=1, 2, …, T, m=1, 2, …, M),在这种情况下,对所有时点的先行指标有影响的变量的集合可以用第i行第j列为Xtm的(T×M)维矩阵X来表示,把X′X的第t个特征根(Eigen Value)称为λt, λt的特征向量(Eigen Vector)中长为1的特征向量称为Et时,Et为( 1)维向量。

这样定义而得的Et就成为第t个主成分,根据Et的定义,Et′Et=1和Et′Eτ=0成立(tτ), X可以由比M小的n个主成分来解释,见公式(1-1)。

其中∑(1, n)指的是t从1到n之和,而at是可以用at=X′Et求得的(M×1)维向量,根据at的定义,Pt可以以公式(1-2)表示。

方程式(1-2)是构成X的各项因素以at进行加权平均,对各时点赋予1个值。由此可知,Et具有作为一个指数的意义,接下来的问题就是利用n个主成分,构建起指数LI。构建指数时考虑各主成分的解释力和各主成分对于各个因素的解释力,进行加权平均。

t个主成分Et的解释力为λt/trX′X)。按Et的解释力对主成分进行加权平均时,结果如式(1-3)所示。

其中1/trX′X)对于所有时点都适用,因此根据LI对各时点取值无意义,可以忽略。但是各主成分对于各个因素的解释力不同,因此式(1-3)不能照用于LI

假设XmX的第m列,atmat的第m个元素。此时,第t个主成分对第m个因素的解释力为, Xm′Xm对所有主成分都适用,atm的权值ωtm如式(1-4)所示。

那么第m个因素对先行指标的影响程度Wm为:

假设W的第m个元素Wm为(M×1)维向量,那么考虑各主成分的解释力与各主成分的各个因素的解释力的差异进行加权平均得到的指数LI则可以如式(1-6)来表示。

其中LI是(T×1)维向量,则LI的第t个元素就是t时点的先行指标LIt

接下来看一看求解Stock-Watson指数,即SW景气指数的过程。求解SW景气指数的过程可以理解为在同一序列中找出一个因素建立模型的过程。以下方程即构成求解SW景气指数的典型模型。

其中B是滞后算子(Lag Operator), i. i. d. N为独立同正态分布(Identically and Independently Distributed Normal)。MVN为多元正态分布(Multivariate Normal)。而βB)、γB)、φB)、AB)等次数分别为(n×k)、(n×r)、(r×r)和(n×n)的参数矩阵。

在观测方程(Observation Equation)(1-7)中,Yt作为(n×1)维向量,是在t期可以观测到的n个变量构成的变量向量,Xt为( 1)次的向量,是由能解释Yt的可以观察到的k个变量构成的向量。而在状态方程(State Equation)(1-8)中,状态向量(State Vector)nt的次数为(r×1),是由可能无法观察到的变量构成的向量,在这种情况下nt即为SW景气指数。状态方程式(1-8)显示的是状态向量的滞后结构,方程式(1-9)表现的是观测方程中包含的误差项的性质。求解SW景气指数,就是从上述方程式中推算出βB), γB), φB), AB),然后动态规划求解nt。忽视附加的解释变量Xt,为求解一个SW景气指数假定共同趋势同一时,k=0和r=1成立。这样求得的一个nt就是SW景气指数。

韩国学界采用基于先行指标的模型对本国数据进行分析的研究不少。Kim Jaeyeong、Jeong Jaeha创建了同步指标和先行指标用于预测建设业景气,创建指数时使用的变量包括建筑许可面积、水泥供货量、国内建筑接单额、国内机械接单额、钢筋出货量、建设部门贷款额、建设业就业人数等。Im Seungjik、Kim Yongsun则创建了同步指标和先行指标用于预测住房景气,使用的变量包括住房买卖价格、住房传贳价格、土地价格变动率、建筑许可面积、建筑接单额、建筑材料出货量、建设业工资、GDP、住房投资、股指、消费者物价指数等。徐昇焕、Lee Byeongyeon等则利用各种宏观经济变量创建出土地价格波动预测指标,使用的变量包括土地价格变动率、M2、消费者物价指数、生产者物价指数、GNP平减指数、实际GNP增长率、建筑许可面积、股价、利率等。利用先行指标构建模型也难以反映政策变化,因此预测时也存在一定的局限性。

四 各预测模型的预测能力比较

徐昇焕(2005)对纯粹时间序列模型、结构式模型和基于先行指标的模型的预测能力进行了比较,该文采用1992年第1季度到2003年第4季度的住房价格变动率、Pt,以及其他数据,对时间序列模型、结构式模型、基于先行指标的时间序列模型和基于先行指标的结构式模型的预测能力进行了比较,先行指标是计算得到的SW景气指数。

检验上述模型的预测能力时,一般采用样本数据之外的预测数据,但是徐昇焕则将1992年第1季度到2003年第4季度数据的推断结果用于各个部分样本来检验其预测能力。从样本期间中住房价格的上年同比变动率、Pt的波动来看,2002年按之前的趋势值持续上行,而2003年则进入下行期。根据预测的经验值看,在拐点前后,预测的误差最大。为了确认这一点,构建模型对2002年第1季度到第4季(例1)和2003年第1季度到第4季度(例2)的两个时期进行了对比。

采用时间序列模型时,下面的ARIMA(2, 1, 2)最为适合。

上式中的ΔPt=Pt-Pt-1,括号中的数值为t-, ρ为1次自回归系数,DW为Durbin-Watson的d -统计量,adj -R2为自由度调整复决定系数。时间序列模型的预测能力如表1-3所示。在表1-3中,FPt显示的是该期间的Pt的预测值,RMSE为标准误差(Root Mean Squared Errors),是(FPt-Pt/Pt平方后取平方根。正如预测,例2的预测误差比例1显著要高。

表1-3 时间序列模型的预测能力

结构式模型采用的解释变量包括实际经济增长率Yt、住房认购存款账户数变动率SHt和3年满期的国家公债利率的利率变动率Rt等,推算结果如下。

例1和例2的预测结果如表1-4所示。正如预想,拐点前后RMSE的平均值例2比例1要大10倍以上。

表1-4 结构式模型的预测能力

对比表1-3和表1-4可知,结构式模型的预测能力要优于纯粹时间序列模型,但是该文在对预测能力进行检验时,结构式模型中采用了未来外生变量的实际值,这意味着对外生变量的预测是完全预见(Perfect Foresight),因此使得结构式模型的预测能力提高。考虑到这一点,我们难以得出在一般情况下,结构式模型的预测能力优于时间序列模型的结论。

接下来检验一下,引进SW景气指数SWIt时,预测能力是否提高。徐昇焕(2005)计算得到的SW景气指数比Pt先行1个季度,因此决定采用该SWIt -1为解释变量,由此可以构建起以下结构式模型和纯粹时间序列模型。

从上述结果可知,在结构式模型和时间序列模型中,SW景气指数都具有有效的解释力,为了检验加入SW景气指数时预测能力的变化,依然分成例1和例2来比较。

时间序列模型的结果如表1-5所示,对比表1-3和表1-5中(例2)的预测误差的绝对值,在加入SW景气指数后,预测误差的平均值从0.6915减少到0.1408,缩减了约1/5。但是在例1中,预测误差反而有所增加,这意味着在例1中,SW景气指数未能使预测能力增加。

表1-5 包含SW景气指数的时间序列模型的预测能力

对结构式模型进行检验的结果也与纯粹时间序列模型相似。对比表1-5和表1-6中(例2)的预测误差的绝对值,在加入SW景气指数后,预测误差的平均值从0.3408减少到0.1904,几乎减少了一半。但是在例1中,预测误差反而有所增加,这意味着在例1中,SW景气指数未能使预测能力增加。

表1-6 包含SW景气指数的结构式模型的预测能力

五 房地产市场的早期预警系统

房地产市场价格波动的早期预警系统虽然不是直接预测房地产价格的变化,但能事先捕捉到房地产市场价格变动的异常征兆,所以在此进行论述。

关于建立早期预警系统(Early Warning System, EWS)的讨论自1997年亚洲金融危机之后开始变得相当活跃,特别是以国际货币基金组织等为中心构建起了早期预警系统。韩国在1999年成立了国际金融中心,负责与外汇危机相关的EWS系统的开发。

在EWS的构建过程中,首先要对危机进行定义。汇率处于压力状态一般定义为外汇市场压力指数超过特定的临界值,这个指数以名义汇率、国际储备、利率等变量的相对变化加权平均构成。该临界值定义为压力指数的平均值加上k倍的标准偏差,k值为3~1.1, k取值的理论依据相当薄弱,最理想的取值应能最好地反映现实。

房地产市场的危机一般表现为房地产价格的暴涨,因此,住房市场的压力指数基本上是根据房地产价格变动率的组合构建而成的。因为存在各种房地产价格指标,仅考虑价格,也可能存在多种压力指数的构建方法。例如,对于住房市场,不仅存在住房买卖价格和住房传贳价格,而且不同地区的价格指数也不同,因此可能的组合很多。住房市场压力指数的构建基本上是根据住房价格指数,但是也可以摸索引进与住房交易量等相关指标的可能性。不管以何种方式构建住房市场压力指数,其临界值都定义为这一压力指数的均值加上k倍的标准偏差。如果某一时点压力指数超过临界值,就可以将这一时点视为危机爆发。

构建EWS的方法有信号模型(简称KLR方法)和Probit模型等。信号模型选用对危机的解释力强的变量、先行指标等,当先行指标的数值超过临界值时,视为信号发生,以此来预测危机。而Probit模型是假设事件发生概率服从累积正态分布函数的二分类因变量模型。考虑到模型使用的便利性,以信号模型来构建EWS更为可取。

徐昇焕(2004)的研究论文中以信号模型来构建住房市场的EWS,其中使用的宏观经济变量包括综合股指、韩币对美元的汇率、三年期国债利率、总流动性、客户存款、景气先行指数、银行存贷比(总贷款/总存款)、消费者物价指数、工业生产指数和工资等。而房地产市场相关的变量则包括建筑业板块的股指、大规模的建设接单额、公寓房供应套数、住房认购存款账户数、全国居住地区土地交易面积等,分别选定临界值,根据超过临界值的变量值构建危机综合指数,以此来求出危机发生的概率,并对今后12个月内住房市场发生危机的概率进行预测。预测结果如图1-3所示,比较好地反映了实际发生的危机的情况。

图1-3 信号模型预测的上行期的危机发生概率