1.3 非线性系统融合估计

1.3.1 信息融合结构模型

信息融合结构模型根据不同应用领域和需要,描述信息融合系统及其子系统的各部分组成、相互间关系、各部分主要功能等。目前被广泛应用的结构模型有:1987年Boyd提出的类似于反馈控制结构的Boyd回路模型[81],也称为OODA(Observe Orient Decide Act)环模型,如图1-2所示;1988年Luo和Kay提出的多传感器集成融合模型[82],如图1-3所示;1989年Thomopoulos提出的Thomopoulos融合模型[83],如图1-4所示;1993年Shulsky在Boyd回路模型基础上提出的情报环模型[84],如图1-5所示;1997年,Dasarathy提出的Dasarathy模型[85],如表1-1所示;1998年Harris提出的一种瀑布模型[86],如图1-6所示;2000年,Bedworth等人提出的混合模型[87],如图1-7所示;2001年,加拿大洛克西德马丁公司开发出的一种扩展OODA模型[88],如图1-8所示;美国国防部联合指挥实验室(Joint Director Laboratory,JDL)于1984年提出了JDL信息融合模型。

图1-2 Boyd回路模型

图1-3 多传感器集成融合模型

图1-4 ThomopouIos融合模型

图1-5 情报环模型

表1-1 Dasarathy模型

图1-6 瀑布模型

图1-7 混合模型

图1-8 扩展OODA模型

经过多年的改进和推广使用,直到1999年,Steinberg提出了现在的JDL信息融合模型,如图1-9所示。JDL信息融合模型已经成为美国国防信息融合系统的一种标准模型。该版本的JDL信息融合模型已经不再局限于军事领域,在各类信息融合领域被广泛采用。之后又有Bowman于2004年提出的修正JDL信息融合模型,以及后来被很多学者增加的第5级——认知优化的JDL信息融合模型。

图1-9 JDL信息融合模型(1999年版)

JDL模型把数据融合分为5级。

第0级——次目标估计,在像素级和信号级,根据数据关联和特征估计信号的可测状态。该级可以在确保信号源获取信号尽量少损失的情况下,压缩数据源信号,为后续更高级别的信息融合保留尽量多的有效信息。该层次对应的是:Boyd回路模型中观测环节的一部分功能,集成融合模型中信号级融合和像素级融合的一部分功能,Thomopoulos模型中信号级融合的一部分功能,情报环模型中情报收集的一部分功能,瀑布模型中预处理环节一部分功能,混合模型和扩展OODA模型中观测环节中的部分功能。

第1级——目标估计,根据第0级的处理结果估计和预测目标的状态和属性。该层次对应的是:Boyd回路模型中观测环节的一部分功能,集成融合模型中信号级融合和像素级融合的一部分功能,Thomopoulos模型中信号级融合的一部分功能,情报环模型中情报收集的一部分功能,瀑布模型中预处理环节一部分功能,混合模型和扩展OODA模型中定向环节中的一部分功能。

第2级——态势估计,根据第1级提供的目标状态信息构建状态走势,识别出有价值的或有意义的事件和行动。该层次对应的是:Boyd回路模型中定向环节的一部分功能,集成融合模型中特征级融合的一部分功能,情报环模型中情报整理的一部分功能,瀑布模型中特征提取环节功能,混合模型和扩展OODA模型中定向环节中的一部分功能。

第3级——影响估计,根据第2级处理结果,对采取的计划、行动等可能带来的结果进行解释和评估,并剖析各种计划、行动的优缺点。该层次对应的是:Boyd回路模型中定向环节的一部分功能,集成融合模型中特征级融合的一部分功能,情报环模型中情报整理和情报评估的一部分功能,瀑布模型中态势估计和决策推理环节功能,混合模型和扩展OODA模型中定向环节和决策环节中的一部分功能。

第4级——过程优化,在整个融合过程中负责监控各个环节性能,形成一种更为有效的资源分配方案,相当于整个系统的反馈部分。

从上面的任务层分解可以看出,JDL信息融合模型任务分配更加明确,适用面更广,因此在信息融合领域被普遍认可和广泛使用。JDL信息融合模型没有给出类似于Boyd回路模型、混合模型和扩展OODA模型中的行动环节,只给出各种情况的评价。本书采用JDL信息融合模型框架,重点研究第0层的数据压缩及第1层目标估计中的状态估计等问题。

1.3.2 信息融合的主要技术方法

信息融合是一门包含控制理论、信号处理、概率统计、信息论方法、人工智能、心理学和生物学等的交叉学科。本书将按照JDL信息融合模型的层次归纳一些各层次常用的理论、方法或算法。

(1)第0级次目标估计,主要负责原始信号源的压缩和传输,因此经常使用到的技术包括加权平均法和数据压缩技术等。

(2)第1级目标估计,该层主要负责数据关联、状态估计、识别与分类[89-91]。数据关联主要用到的技术有最近邻域法、全邻域法、智能活生物仿真方法、多假设法、图论法等。而状态估计主要用到的是各种滤波算法,包括:经典Kalman滤波算法(Kalman Filter,KF)、扩展Kalman滤波算法(Extended Kalman Filter,EKF)、粒子滤波算法(Particle Filter,PF)、无迹Kalman滤波算法(Unscented Kalman Filter,UKF)、容积Kalman滤波算法(Cubature Kalman Filter,CKF)等。还有特殊情况下采用的,诸如带有相关噪声的滤波器、可处理丢失观测数据的滤波器、广义Kalman滤波等。识别与分类常用的方法有:贝叶斯推理、多贝叶斯法、D-S证据理论、证据推理、产生规则法、聚类算法、选举法、熵方法、模糊集理论、人工神经网络等。

(3)第2级态势估计和第3级影响估计,主要用到的方法包括:聚类算法、深度学习法、模糊集理论、人工神经网络、决策树等。

(4)第4级过程优化主要负责性能评估,因此常用到的理论包括:效应理论[92]、各种系统评价指标和方法等。

1.3.3 非线性系统估计研究现状

1960年,Rudolf Emil Kalman提出了Kalman滤波算法[93-94],标志着现代滤波理论的正式建立。Kalman滤波算法采用时域递推形式,给出了一种无偏的最小方差估计,是贝叶斯估计方法在线性、Gauss条件下的一种特殊形式。但很快人们发现Kalman滤波在很多情况下显得无能为力,例如在非线性系统中。在实际工程中,绝大多数系统含有非线性环节。由于非线性系统复杂性和不确定性等因素,此类系统无法应用最小均方(Least Mean Square,LMS)估计得到经典Kalman滤波器。为此,Sunahara和Bucy等人提出了最直接的非线性滤波算法——扩展Kalman滤波器EKF[95-98]。EKF对系统的非线性环节采用Taylor展开式进行1阶线性化截断,并用Jacobian矩阵代替KF滤波方程中的状态转移矩阵,但是EKF存在很多局限性和不足[99-103]。例如,对于某些强非线性环节,由1阶线性化截断方法产生的系统偏差,会导致后续Kalman滤波过程的估计偏差或发散,又或者在EKF运行期间,某个预报值的偏差会导致Jacobian矩阵偏差,致使整个估计系统呈现估计发散。

Julier等人[104-114]提出了无迹Kalman滤波器。UKF不同于EKF的线性近似,它根据UT变换(Unscented Transformation)将固定点采样变换后的点逼近非线性变换的概率密度特性。其滤波精度和计算量都要优于EKF,适用于非线性Gauss系统。

粒子滤波器 [115]的思想基于Monte-Carlo方法,由于没有采用固定点采样,故其方法更灵活、易于实现,因此近年来该算法在许多领域得到成功应用,而且PF算法适用于非线性、非Gauss分布的情况。

Ienkaram等提出的容积Kalman滤波器 [116-118],较好地解决了UKF高维状态(4维以上)时,参数不易选择,滤波效果不理想的问题。以上3种滤波器中,PF在采样粒子数足够多的情况下,精度最高,但计算量也最高,UKF和CKF在参数选择恰当的情况下精度和计算量相当。3种滤波器共同的特点是采用了采样方法近似非线性分布情形。

1.3.4 融合估计研究现状

本书涉及的信息融合问题有JDL信息融合模型第0层的数据压缩及第1层目标估计中的状态估计。涉及这两层的融合结构目前大致分为以下3种:集中式融合(见图1-10)、分布式融合(见图1-11),以及混合式融合(见图1-12)。

集中式融合估计将所有传感器信息进行扩维并输出融合状态估计[119-120],如图1-10所示。该算法由于没有信息丢失,其最大的优点是当所有传感器没有故障时估计精度具有全局最优性,可作为其他融合算法的衡量标准,也是现在多传感器系统经常采用的融合方式之一[121]。然而,由于集中式融合算法计算量大,在传感器数量较多的情况下,集中式融合算法会导致整个系统实时性差。特别是当存在故障传感器时可能导致滤波器发散。

图1-10 集中式融合模型

分布式融合算法把各个局部状态估计送入融合中心,根据一定的融合准则进行加权得到融合估计[17][57-58],如图1-11所示。由于分布式融合采用了并行计算的结构,因此其具有良好的鲁棒性和灵活性[61],估计精度是局部最优、全局次优的。目前很多工作在JDL模型第1层的分布式融合算法,例如联邦Kalman滤波器、按矩阵加权融合、按对角阵加权融合、按标量加权融合[56-59]、CI融合算法(Covariance Intersection fusion,CI)[56][122-125]都已经在线性系统中有了很好的应用。这些分布式融合算法将整个融合系统的第0层的数据融合及第1层负责的状态估计很好地统一在了一起,是现在工作在该层主要算法之一。

图1-11 分布式融合模型

鉴于分布式融合和集中式融合各自的优缺点,专家提出了混合式融合估计结构,如图1-12所示。混合式融合结构具有分布式融合的鲁棒性与灵活性,又兼具集中式融合的全局最优性,但是这样一种结构会给系统带来额外的计算负担,降低系统的实时性。

图1-12 混合式融合模型

加权观测融合属于集中式融合范畴,其结构类似于图1-10所示结构。该算法根据加权最小二乘准则,将集中式融合系统增广的高维观测进行压缩处理,得到降维的观测,基于降维观测设计的滤波器可以明显地减小计算负担。由于该算法基于集中式融合框架,其优点是数据损失小,后续滤波精度高。对于线性系统,加权观测融合算法在最小方差意义下和集中式融合算法具有数值等价性,因而具有全局最优性和重要的应用价值[126]。加权观测融合工作在JDL模型第0层,负责数据压缩,其最大的特点是极大地保留了原始信息,并尽可能地减少数据量,为后续滤波等环节降低计算负担,提高系统实时性。相比于分布式融合,加权观测融合滤波器具有较高的融合估计精度。

1.3.5 非线性系统融合估计研究现状

基于线性模型的融合估计经过40多年的发展已经形成了一套完整的体系算法。然而大量系统并非是理想的线性模型。例如,绝大多数导航、目标跟踪等系统的观测方程(测量传感器)是基于球面坐标系建立的,相对于在笛卡尔坐标系下建立的状态方程而言,这些观测方程是非线性的而且是强非线性的方程[121][127]。许多学者对非线性多传感器系统融合问题提出了解决方案,其中最早的也是最为常见的是集中式融合[52],其结构简单、融合精度高、易于实现,但缺点是计算量大。

之后有学者以EKF为基础,仿照线性融合方法提出了一类非线性融合方法[128-134]。这类方法都是以线性函数近似方法实现的,简单有效,可以将非线性问题转换为线性问题进行处理。但类似EKF的近似线性化方法(略去2阶以上Taylor级数展开项)大量信息被略去,导致估计结果产生较大偏差,甚至导致滤波器的发散,使得这一类融合算法一直得不到进一步发展。

1997年,考虑到非线性系统的复杂性和不确定性及估计间协方差不易求得的矛盾,Julier等人提出了一种不需要求解估计间协方差的融合算法——CI融合算法 [104-109][135]。该方法适用于线性和非线性系统,结构简单,但滤波精度普遍低于矩阵融合。

最近10年发展起来的以贝叶斯估计为框架,以采样(粒子)拟合为基础的非线性滤波算法层出不穷,其中较为知名的无迹Kalman滤波器、粒子滤波器及容积滤波器等可以很好地处理单传感器非线性滤波问题,但鲜有报道涉及UKF、PF,以及CKF的多传感器信息融合问题,其原因是非线性系统模型的复杂性和不确定性[136]

近些年很多学者利用随机集(Random Set)、人工神经网络、模糊逻辑(Fuzzy Logic)、粗糙集(Rouhgt Set)、证据推理(Dempster-Shafer)等非概率融合方法处理非线性系统融合问题。但这些方法多用于JDL模型第2级态势估计和第3级影响估计[137]