抽象概念

如果一幅图形景观画不包含具有物理形状的真实物体,而只包含抽象概念的表征(例如通货膨胀率或人口密度),那怎样做才能让这些概念可见呢?现在答案似乎已经很明显了,但几个世纪以来,将抽象概念与特征随底层数据变化的几何形状关联起来却并不容易。

我们可以回忆一下在学校时学过的知识,由维度来区分的四种几何图元:点(无维度)、线(一维)、面或平面(二维)、体(三维)。

当使用维度数作为视觉显示分类标准时,就可以得到四个类别:图表、网络图、地图,以及一个特殊的类别——体积可视化。图 1.6 总结了它们的主要特点 2

2换句话说,表示一个物体所需的最小维度数。可以使用面(一张饼图)或线(条形图中的一个长条),这些都是设计选择,因为你所需要的就是一个点。同样地,用来表示网络图的最小单位是线,而点和面可以用作设计选择。

{%}

图 1.6 各种几何图元类型与视觉表征

图表

图表(chart)中所使用的基本几何图元是点,在二维空间中用一对坐标——横坐标(x)和纵坐标(y)来表示,原点位于左下角(图 1.7)。坐标值向右和向上增加,向左和向下减小。当缺少其中一个坐标值(或者具有固定值)时,点就会沿着相对的轴分布。当使用不同的度量时,需要对这段描述进行相应的调整:在时间序列(图 1.8)中,从左往右的时间点离现在越来越近。

图 1.7 图表是在二维平面上绘制的一组数据点

{%}

图 1.8 威廉·普莱费尔绘制的折线图

资料来源:WikimediaCommons

请注意,图表(chart)这个词有多种含义,可以包括表、地图、图形或网络图。图形(graph)具有更严格的定义,是一个或多个变量的视觉表现形式。尽管图形的英文可能会与另一个数学专业领域——图论相混淆,但我非常肯定的一点是,真正应该使用的词汇是图形而不是图表。可惜的是,30 多年前微软决定在 Excel 中使用图表一词,现在如果叫“Excel 图形”就会感觉有点儿不合适,而必须要说“Excel 图表”。由于本书的目标读者是 Excel 用户,因此在本书中将使用“图表”一词,并将其定义为可以从 Excel 图表库中找到或衍生出的视觉对象。

更抽象地说,图表就是将数据表转化为坐标,然后应用设计转换使其形象化这一过程的产品。很快你就会明白这是什么意思了。

在将数据表值转化为数据点并在平面上将其画出来之后,就会生成一个数据点云,从而可以得到数据点之间相对距离的精确表示。这是我们后面所要做的所有事情的基础,因为当我们看到并比较数据点之间的距离或者其到坐标轴之间的距离时,就会开始发生很多事情。怎样处理这些数据点云呢?我们基本上会通过一些方式使其可见,例如使用线来将这些点连接起来,生成折线图等。这些补充图元对于阅读图表以及图表的有效性至关重要。

网络图

线(line)是显示网络图所用的主要几何图元(图 1.9),它表示了数据点之间的连接。我们仍然需要在二维平面上画出数据点,但它们的坐标是灵活的,可以改变坐标来更好地表示这种关系。尽管在网络图可视化过程中点和线都同样有意义,但在网格分析中观察关系以及发现有意义的行为(中心、模式、异常值等)是首要目标。

图 1.9 使用 NodeXL 创建的简单的网络图

网络图表示法的一个经典案例就是伦敦地铁图。其中的地理位置参考信息是模糊的,人们通常使用地铁站数而不是公里数来衡量距离。

地图

地图也可以使用点和线,但它对于区域的使用将它与图表和网络图区分开来。地图是视觉显示中最丰富多彩的形式,也是我们使用时间最长的一种形式(图 1.10)。

{%}

图 1.10 用点、线和面积绘制的图:瓦胡岛地图

资料来源:Open Street Map

体积的可视化

大多数的可视化是在二维平面(如一张纸或屏幕)上进行的。当仿真技术允许对三维数据图进行浏览时,可能就会进入一个现在还没有到来的新时代。这不仅仅是技术问题,也是知觉问题。在三维空间中,一个物体可能会隐藏在另一个物体之后(遮挡)。人类的知觉将距离因素考虑进来之后,就不太擅长比较物体的大小了。比如,某辆车是真的比另一辆更大,还是只因为前者离我们更近呢?

我们可以使用仿 3D 技术。科学可视化就经常使用仿 3D 技术来进行物理对象建模。不幸的是,当应用到抽象概念上时,结果并不理想。我们所得到的就是很多 3D 可视化,其中的第三个维度是没有意义、无关痛痒的,只是装饰性的。在本书后面的内容中我们还将讨论这一点。

因此,我们不会为三维可视化预留容量,而是会为表现真实世界的对象或未直接连接到数据表的对象预留容量。例如,这种表现形式通常出现在报纸或杂志上,用来说明事故是如何发生的。不管是单独使用还是与其他形式的可视化相结合,它们的效果都不错。我们通常将其称为插图(illustration),但这个称呼太笼统了。我更喜欢称之为体积可视化,因为它们描述了一个物理对象或现实。

Excel 中的可视化

图表、网络图、地图和体积可视化都具有一些共同的可视化特点,但它们又各不相同,以至于几乎不可能将它们结合在一个工具中。众所周知,图表是像 Excel 这样的电子表格软件所提供的主要可视化类型。

在 Excel 中也可以制作基本的网络图和地图,但这需要做大量的工作,还可能需要购买插件。对于这样的软件来说,也会感到很不“自然”,尽管这一点在 Excel 2016 中已经开始有所改变。这也是我们在本书中专注于图表的原因,尽管你应该知道,图表只是数据可视化所有可能形式中的一种。