- 智能语音处理
- 张雄伟 孙蒙 杨吉斌
- 929字
- 2021-04-01 02:35:57
2.2.1 稀疏
广义上的信号稀疏是指信号具有如下特性:信号中只有少数元素是非零(或绝对值较大)值,其余元素均为零(或绝对值很小),即如图2-1所示的例子。用数学符号表示就是,给定信号x∈ℝN,其非零元素个数‖x‖0满足:
‖x‖0≪N
(2-1)
即使信号在某个观测域(如时域)内不具有稀疏性,但在变换域中依然可能是稀疏的,这样的信号也称为稀疏信号。
因此,给定信号x∈ℝN,可以给出稀疏的两种数学定义:
①对于正交基{ψi:i=1,2,…,N},信号x在基上的投影(即变换系数)为θi=〈x,ψi〉。若存在实数0<p<2以及R>0,使得lp范数‖θ‖p满足:
则称信号在基Ψ上lp范数稀疏[2]。
②如果信号变换系数θi=〈x,ψi〉的支撑域(即非零元素构成的集合){i:θi≠0}的元素个数小于等于K,则可以说信号x是K稀疏的[3]。
信号的稀疏通常体现在某一个表征域上,因此常说信号在某表征域上是稀疏的。具有稀疏特性的表征形式称为这个信号的稀疏表示。事实上,绝大多数自然信号均存在稀疏表示。
例如,图2-2所示的是一段双音信号,在波形上看包络有起伏,但绝大多数采样点均不等于零,似乎没有稀疏特性。但观察它的时频谱图可以看出,在绝大多数频率上,信号的功率分布近似为零。因此,可以说该信号在频域上是稀疏的。
上述定义①中使用的lp范数是描述信号稀疏的一个重要概念,它是欧几里得范数(p=2时的lp范数)的推广。
图2-3给出了在几个典型的p取值条件下,lp为常数的三维曲面。在这个曲面上的任意一点x,其坐标(x1,x2,x3)满足‖x‖p=L(L是常数)。当p=2时,这个曲面就是常见的球面。当p=1时,这个曲面就是八面体。当p取值越来越小时,曲面由“凸”变为“凹”,曲面与坐标轴的交点处各方向上的斜率越来越大。当p=0时,曲面退化为多条与坐标轴重合的线段,此时,这个曲面上的点都至少有两个坐标分量为0,即这些三维坐标点都满足如下的形式:(x1,0,0)或(0,x2,0)或(0,0,x3)。这些点都具有了稀疏特性。
由上述分析可知,当p=0时,lp范数对应的信号稀疏特性最严格。虽然式(2-2)中p不能为0,l0范数的严格定义不满足式(2-2)的形式,但由于lp范数稀疏在数学推导上非常方便,因此很多情况下都直接采用l0这种广义的信号稀疏定义方式。