4.3 图像的基本属性及种类

4.3.1 分辨率

分辨率可以从显示分辨率与图像分辨率两个方向来分类。

显示分辨率(屏幕分辨率)是屏幕图像的精密度,是指显示器所能显示的像素有多少。由于屏幕上的点、线和面都是由像素组成的,显示器可显示的像素越多,画面就越精细,同样的屏幕区域内能显示的信息也越多,所以分辨率是个非常重要的性能指标之一。可以把整个图像想象成是一个大型的棋盘,而分辨率的表示方式就是所有经线和纬线交叉点的数目。显示分辨率一定的情况下,显示屏越小图像越清晰,反之,显示屏大小固定时,显示分辨率越高图像越清晰。

图像分辨率指图像中存储的信息量,是每英寸图像内有多少个像素点,分辨率的单位为ppi(pixel per inch),通常称为像素每英寸。

分辨率决定了位图图像细节的精细程度。

通常情况下,图像的分辨率越高,所包含的像素就越多,图像就越清晰,印刷的质量也就越好。同时,它也会增加文件占用的存储空间。

分辨率是度量位图图像内数据量多少的一个参数。通常表示成每英寸像素(pixel per inch,ppi)和每英寸点(dot per inch,dpi)。包含的数据越多,图形文件的长度就越大,也能表现更丰富的细节。但更大的文件需要耗用更多的计算机资源、更多的内存、更大的硬盘空间等。假如图像包含的数据不够充分(图形分辨率较低),就会显得相当粗糙,特别是把图像放大为一个较大尺寸观看的时候。所以在图片创建期间,必须根据图像最终的用途决定正确的分辨率。这里的技巧是要保证图像包含足够多的数据,能满足最终输出的需要。同时要适量,尽量少占用计算机的资源。

分辨率和图像的像素有直接关系。一张分辨率为640×480的图片,它的分辨率就达到了307200像素,也就是常说的30万像素;而一张分辨率为1600×1200的图片,它的像素就是200万。

在平面设计中,图像的分辨率以ppi来度量,它和图像的宽、高尺寸一起决定了图像文件的大小及图像质量。比如,一幅图像宽8英寸、高6英寸,分辨率为100ppi,如果保持图像文件的大小不变,也就是总的像素数不变,将分辨率降为50ppi,在宽高比不变的情况下,图像的宽将变为16英寸、高将变为12英寸。打印输出变化前后的这两幅图,会发现后者的幅面是前者的4倍,而且图像质量下降了许多。那么,把这两幅变化前后的图送入计算机显示器会出现什么现象呢?比如,将它们送入显示模式为800×600的显示器显示,会发现这两幅图的画面尺寸一样,画面质量也没有区别。对于计算机的显示系统来说,一幅图像的ppi值是没有意义的,起作用的是这幅图像所包含的总的像素数,也就是前面所讲的另一种分辨率表示方法:水平方向的像素数×垂直方向的像素数。这种分辨率表示方法同时也表示了图像显示时的宽高尺寸。前面所讲的ppi值变化前后的两幅图,它们总的像素数都是800×600,因此在显示时是分辨率相同、幅面相同的两幅图像。

图像分辨率的表达方式也为“水平像素数×垂直像素数”,也可以用规格代号来表示。

不过需要注意的是,在不同的书籍中,甚至在同一本书中的不同地方,对图像分辨率的叫法不同。除图像分辨率这种叫法外,也可以叫做图像大小、图像尺寸、像素尺寸和记录分辨率。在这里,“大小”和“尺寸”一词的含义具有双重性,它们都可以既指像素的多少(数量大小),又可以指画面的尺寸(边长或面积的大小),因此很容易引起误解。由于在同一显示分辨率的情况下,分辨率越高的图像像素点越多,图像的尺寸和面积也越大,所以往往有人会用图像大小和图像尺寸来表示图像的分辨率。

4.3.2 颜色深度

颜色深度是指存储每个像素所用的位数,它也是用来度量图像的分辨率。像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。

颜色深度简单说就是最多支持多少种颜色。一般是用“位”来描述的。“位”(bit)是计算机存储器里的最小单元,用来记录每一个像素颜色的值。图形的色彩越丰富,“位”的值就会越大。每一个像素在计算机中所使用的这种位数就是“位深度”。在记录数字图形的颜色时,计算机实际上是用每个像素需要的位深度来表示的。

黑白二色的图形是数字图形中最简单的一种,它只有黑、白两种颜色,也就是说它的每个像素只有1位颜色,位深度是1,用2的一次幂来表示;4位颜色的图,它的位深度是4,用2表示,它有2的4次幂种颜色,即16种颜色或16种灰度等级。8位颜色的图,位深度就是8,用2的8次幂表示,它含有256种颜色(或156种灰度等级)。24位颜色可称为真彩色,位深度是24,它能组合成2的24次幂种颜色,即16777216种颜色,超过了人眼能够分辨的颜色数量。当用24位来记录颜色时,实际上是以28×3,即红、绿、蓝三基色各以2的8次幂(256)种颜色而存在的,三色组合就形成一千六百万种颜色。

颜色深度越大,图片占的空间越大,如表4-1所示。

表4-1 色彩深度关系

虽然颜色深度越大能显示的色数越多,但并不意味着高深度的图像转换为低深度(如24位深度转为8位深度)就一定会丢失颜色信息,因为24位深度中的所有颜色都能用8位深度来表示,只是8位深度不能一次性表达所有24位深度色而已(8位能表示256种颜色,这256色可以是24位深度中的任意256色)。

4.3.3 图像的大小及种类

1.图像的大小

图像大小的长度与宽度是以像素为单位的,有的是以厘米为单位。像素与分辨率像素是数码影像最基本的单位,每个像素就是一个小点,而不同颜色的点(像素)聚集起来就变成一幅动人的照片。数码照相机经常以像素作为等级分类依据,但不少人认为像素点的多少是CCD光敏单元上的感光点数量,其实这种说法并不完全正确,目前不少厂商通过特殊技术,可以在相同感光点的CCD光敏单元下产生分辨率更高的数码相片。

图片分辨率越高,所需像素越多,比如,分辨率640×480的图片,大概需要30万像素,2084×1536的图片,则需要高达314万像素。

分辨率可有多个数值,相机提供分辨率越多,拍摄与保存图片的弹性越高。

图片分辨率和输出时的成像大小及放大比例有关,分辨率越高,成像尺寸越大,放大比例越高。

总像素数是指CCD含有的总像素数。不过,由于CCD边缘照不到光线,因此有一部分拍摄时用不上。从总像素数中减去这部分像素就是有效像素数。

2.图像的种类

(1)基于色彩特征的索引技术

色彩是物体表面的一种视觉特性,每种物体都有其特有的色彩特征。比如,人们说到绿色往往是和树木或草原相关,谈到蓝色往往是和大海或蓝天相关。同一类物体往往有着相似的色彩特征,因此可以根据色彩特征来区分物体。用色彩特征进行图像分类可以追溯到Swain和Ballard提出的色彩直方图的方法。由于色彩直方图具有简单且随图像的大小、旋转变化不敏感等特点,得到了研究人员的广泛关注,目前几乎所有基于内容分类的图像数据库系统都把色彩分类方法作为分类的一个重要手段,并提出了许多改进方法,归纳起主要可以分为两类:全局色彩特征索引和局部色彩特征索引,如图4-16所示。

■图4-16 局部色彩特征分析

(2)基于纹理的图像分类技术

纹理特征也是图像的重要特征之一,其本质是刻画像素的邻域灰度空间分布规律。由于它在模式识别和计算机视觉等领域已经取得了丰富的研究成果,因此可以借用到图像分类中。

在20世纪70年代早期,Haralick等人提出纹理特征的灰度共生矩阵表示法(Eo-occurrenee Matrix Representation),这个方法提取的是纹理的灰度级空间相关性(gray level Spatial dependence),它首先基于像素之间的距离和方向建立灰度共生矩阵,再由这个矩阵提取有意义的统计量作为纹理特征向量。基于一项人眼对纹理的视觉感知的心理研究,Tamuar等人提出可以模拟纹理视觉模型的6个纹理属性,分别是粒度、对比度、方向性、线型、均匀性和粗糙度。QBIC系统和MARS系统采用的就是这种纹理表示方法。

在20世纪90年代初期,当小波变换的理论结构建立起来之后,许多研究者开始研究如何用小波变换表示纹理特征。Smiht和Chang利用从小波子带中提取的统计量(平均值和方差)作为纹理特征。这个算法在112幅Brodatz纹理图像中达到了90%的准确率。为了利用中间带的特征,Chang和Kuo开发出一种树形结构的小波变化来进一步提高分类的准确性。还有一些研究者将小波变换和其他变换结合起来以得到更好的性能,如Thygaarajna等人结合小波变换和共生矩阵,以兼顾基于统计的和基于变换的纹理分析算法的优点。

(3)基于形状的图像分类技术

形状是图像的重要可视化内容之一。在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及对轮廓边界的描述以及对这个边界所包围区域的描述。目前基于形状分类方法大多围绕着从形状的轮廓特征和形状的区域特征建立图像索引。对形状轮廓特征的描述主要有直线段描述、样条拟合曲线、傅里叶描述以及高斯参数曲线等。Photoshop中有很多形状展示,如图4-17所示。

实际上更常用的办法是采用区域特征和边界特征相结合来进行形状的相似分类。如Eakins等人提出了一组重画规则并对形状轮廓用线段和圆弧进行简化表达,然后定义形状的邻接族和形族两种分族函数对形状进行分类。邻接分族主要采用了形状的边界信息,而形状形族主要采用了形状区域信息。在形状进行匹配时,除了每个族中形状差异外,还比较每个族中质心和周长的差异,以及整个形状的位置特征矢量的差异,查询判别距离是这些差异的加权和。

■图4-17 Photoshop中的自定义形状

(4)基于空间关系的图像分类技术

在图像信息系统中,依据图像中对象及对象间的空间位置关系来区别图像库中的不同图像是一个非常重要的方法。因此,如何存储图像对象及其中对象位置关系以方便图像的分类,是图像数据库系统设计的一个重要问题。而且利用图像中对象间的空间关系来区别图像,符合人们识别图像的习惯,所以许多研究人员从图像中对象空间位置关系出发,着手对基于对象空间位置关系的分类方法进行了研究。早在1976年,Tanimoto提出了用像元方法来表示图像中的实体,并提出了用像元来作为图像对象索引。随后被美国匹兹堡大学Chang采纳并提出用二维符号串(2D-String)的表示方法来进行图像空间关系的分类。由于该方法简单,并且对于部分图像来说可以从2D-String重构它们的符号图,因此被许多人采用和改进。该方法的缺点是仅用对象的质心表示空间位置;其次是对于一些图像来说不能根据其2D-String完全重构其符号图;再则是上述的空间关系太简单,实际中的空间关系要复杂得多。针对这些问题许多人提出了改进方法。Jungert用图像对象的最小包围盒分别在x轴方向和y轴上的投影区间之间的交叠关系来表示对象之间的空间关系,随后Cllallg和Jungert等人又提出了广义2D-String(2DG-String)的方法,将图像对象进一步切分为更小的子对象来表示对象的空间关系。该方法的不足之处是当图像对象数目比较多且空间关系比较复杂时,需要切分的子对象的数目很多,存储的开销太大。针对此Lee和Hsu等人提出了2DC-String的方法,它们采用Anell提出的13种时态间隔关系并应用到空间投影区间上来表达空间关系。在x轴方向和y轴方向的组合关系共有169种,他提出了5种基本关系转换法则,在此基础上又提出了新的对象切分方法。采用2DC-String的方法比2DG-String切分子对象的数目明显减少。为了在空间关系中保留两个对象的相对空间距离和对象的大小,Huang等人提出了2DC-String的方法提高符号图的重构精度,并使对包含对象相对大小、距离的符号图的推理成为可能。上述方法都涉及将图像对象划分为子对象,且在用符号串重构对象时处理时间的开销都比较大。为解决这些方法的不足,Lee等人又提出了2DB-String的方法,它不要求对象进一步划分,用对象的名称来表示对象的起点和终点边界。为了解决符号图的重构问题,Chin-Chen Chang等人提出了面向相对坐标解决符号图的重构问题,Chin-Chen Chang等人提出了面向相对坐标符号串表示(RCOS串),它们用对象最小外接包围盒的左下角坐标和右上角坐标来表示对象之间的空间关系。

对于对象之间的空间关系采用,Allen提出了13种区间表示方法。实际上上述所有方法都不是和对象的方位无关,为此Huang等人又提出了RSString表示方法。虽然上述各种方法对图像对象空间信息的分类起到过一定作用,但它们都是采用对象的最小外接矩形来表示一个对象空间位置,这对于矩形对象来说是比较合适的,但是当两个对象是不规则形状且它们在空间关系上是分离时,它们的外接矩形却存在着某种包含和交叠,结果出现对这些对象空间关系的错误表示。用上述空间关系进行图像分类都是定性的分类方法,将图像的空间关系转换为图像相似性的定量度量是一个较为困难的事情。Nabil综合2D-String方法和二维平面中对象之间的点集拓扑关系。提出了2D-PIR分类方法,两个对象之间的相似与否就转换为两个图像的2D-PIR图之间是否同构。2D-PIR中只有图像对象之间的空间拓扑关系具有旋转不变性,在进行图像分类的时候没有考虑对象之间的相对距离。