第1章
基本概念

引言

人们普遍认为,大多数经济变量具有非线性关系,所以经济是非线性的。经济理论学家建议,经济模型应该采用限制上下界、具有缓冲库存和区间转换机制的模型。投资函数、生产函数和菲利普斯曲线经常被指定为非线性形式。给定任何一个特定的具有已知形式和未知参数的非线性模型,计量经济学家可以对参数进行估计,给出这些估计量的一些渐进特征(例如,Judge等(1985)和White(1984))。但是,大多数经济理论仅仅给出貌似合理的非线性模型,但常常是不完整的,往往与实际数据不符,特别是对于具有动态结构的经济关系。因而,我们需要探索性的统计技术,结合理论建立合理的计量模型。在时间序列分析领域,线性分析技术已经在单变量和小规模多变量序列中得到了很好的发展(参见Granger和Newbold(1986))。非线性单变量时间序列模型也已经取得了有价值的进展(Tong(1990)对此进展做了综述),而且最近更多的注意力已经转向了多变量模型。本书试图归纳总结这些新进展中比较实用的部分,鼓励计量经济学家使用非线性模型。

线性技术的发展可以分为三个阶段,第一个阶段是单变量模型(Box-Jenkins的ARIMA模型),第二个阶段是多自变量-单因变量模型,即多个变量解释一个变量的模型,例如ARMAX模型),第三个阶段是诸如VAR和VARMA模型的计量模型。这三个阶段的发展也将确定无疑地发生在非线性模型领域。很难从一般性的单变量模型跳跃到实用的多变量模型,尽管本书将讨论一般性结论,但是我们主要讨论利用多个解释变量和滞后因变量解释单一的因变量的非线性模型。

本书只考虑离散型时间序列,这是纯粹地出于实用主义的原因,因为所有的经济变量都是按离散的时间间隔度量的,如小时、日、周、季度等,这些变量时间长度不变。本书不特别关注经济变量是否以连续时间的形式产生。

只有非线性模型才会出现观测序列是确定性还是随机性的问题。虽然本书也涉及确定性的、与随机过程有共性的混沌序列(参见第3章)并给予一定关注,但是本书主要研究随机变量。一般情况下,经济和社会中存在着不可预期的冲击或者创新,再加上测量误差就强烈地预示着经济变量是随机的。一些测量误差会进入经济决策者的决策,因而就会包含在模型中。观测序列因而就不仅仅是信号和噪声的总和,噪声在这里仅仅是测量误差,或许可以被滤除。实际序列可能包含确定性成分,如周期和趋势,而且在任何分析中都需要考虑这一可能性。

非线性模型存在的,而线性模型中不会存在的一个区分是参数和非参数模型。参数模型包括具体的数学函数,如多项式函数和三角函数,只是参数未知。这类模型自然产生的问题就是需要考虑采用什么形式的函数、滞后几期、如何估计参数、如何进行模型评价。非参数模型允许更多的可能形式,而且在某种意义上,可以含有更多的参数,尽管只有部分参数需要估计。非参数模型通常需要利用计算机在大范围内大量搜索可行的模型,因而必须对过度拟合和数据挖掘进行检验。本书在第7章讨论这些模型。

Box和Jenkins(1970)所建议的线性模型的分析步骤如下:

(1)确定模型。利用各种概括性统计数据,针对特定的数据集选择模型,有时需要大体确定滞后阶数。

(2)估计模型。估计所选择模型中的参数。

(3)评价模型。利用各种统计推断方法检验来判断模型的质量,与其他模型进行比较。例如,可以比较不同模型的样本外预测能力。如果模型不合适,那么考虑其他形式的模型。

非线性模型也可以使用以上建模策略的一些成分,本书将在后面详细讨论这一问题。对非线性的精确含义的讨论将放到1.4节。

对于数据集进行建模的非线性模型在数量上已经很多了,而且以后肯定会继续增长。虽然本书会讨论许多这些模型,但是本书主要关注便于计量经济学家使用的相对简单的模型。因而,应该从正确性和实用性两个方面判断模型。迄今为止,使用非线性模型分析经济数据的经验还很少,而且判断各个非线性模型的优劣的研究也很少。由于非线性模型具有形式多样、内在灵活的性质,对于任何的已知数据集,出现虚假的良好拟合模型的概率会很高。因而,在确定模型之前,我们强烈建议进行线性检验(具体见第6章),比较非线性模型与线性模型的样本外估计,进而推断拟合模型的实际质量。在某些情形中,如果样本外阶段在某种程度上恰好呈现“线性”关系,那么以上操作就存在困难,尽管如此,我们依然推荐进行样本外评估。本书将在第8章讨论非线性模型的预测问题。