可视化学习笔记6:Less is More

图表垃圾

在设计可视化图表时,你需要删掉数据中的所有无关内容。Edward Tufte 将所有的无关内容称为图表垃圾

例如,下面这个图表展示的是宇宙飞船火箭助推器的 O 形环损坏。在挑战者号爆炸之后的调查中就出现了这张图。当时的调查确定宇宙飞船爆炸是因为在发射过程中,天气很冷,O 形环出现故障。(O 形环是用来对两个物体之间的空隙进行密封的橡胶环)

火箭助推器中的 O 形环损坏。

该图表中的信息太多,实际上很难从中得出任何信息。火箭是经典的图表垃圾,视觉元素没有表示数据,而是引起干扰。我清理了上图中的数据:

我的挑战者号 O 形环数据版本

根据之前的数据,你立即就能看出挑战者号飞船上的 O 形环几乎肯定会在这一外部温度出现故障。

你有时候还会看到具有图案、3D 效果、密度网格等的图表。所有这些都会影响读者对数据的理解。

Tufte 的“Visual Display”中的经典图表垃圾示例

如果只能从这门课程中学到一样东西的话,那就是请勿使用 3D 效果。不仅仅是因为 3D 几乎始终没必要(是图表垃圾!),而且会歪曲数据。请查看这张 Macworld 2008 年主题演讲中的幻灯片。Apple 最广为人知的就是精彩的设计,但是很明显没有好好的设计可视化图表。

坏的苹果派(没错,这个双关笑话是我想出来的)。

这个饼图存在 3D 效果,顶部向后倾斜。虽然紫色部分标为 21.2%,但是肉眼看去,比绿色 19.5% 部分要小。它们创建了一个本身就很难看明白的饼图,并且变得更糟糕。

数据墨水

即使没有图表垃圾,很多图表也会将很多视觉空间留给非数据元素。Tufte 使用墨水一词来指代图表中的任何视觉元素。表示数据的视觉元素是数据墨水,其他所有元素是非数据墨水。作为设计师,我们应该尽量减少非数据墨水的量,从而删除数据中的干扰项。

查看正常的柱状图。

表示三种鸢尾花物种的平均测量结果的典型柱状图。

上图是一个典型的柱状图。上面存在可以删掉的非数据墨水。例如,图表周围的方框是不表示任何数据的墨水。

同一柱状图,只是没有恼人的方框了。

纵轴没必要存在,除了刻度线之外,所以也可以删了。

没有纵轴的柱状图。

最后,我可以添加白色网格,帮助读者正确地看出长条高度。

用白色网格表示纵轴刻度的柱状图。

通过对比原图和最终版本,可以看出我删除了很多非数据墨水。图表的重心是数据,应该尽量减少干扰性视觉元素。

现在,我们看看可以从另一种常见图表“箱线图”中删除哪些元素。

练习题

对于上述箱线图,图中有很多不表示任何数据的墨水。该箱线图中的哪些元素应该删掉?

  • 水平结束端点

  • 中心方框

  • 异常值标记

  • 正中线

这是删掉所有不必要的标记(例如方框和水平结束端点)之后的箱线图。展示的是同一数据,但是线条少多了。原始图表有 9 个垂直线条和 15 个水平线条。我将其缩减成了 6 个垂直线条和 3 个点。

同一数据,但是墨水更少。

希望你已经明白少即是多。我们应该始终尝试缩减可视化图表,使读者更容易理解。

接着,我将介绍如何设计可视化图表,避免错误地表示数据。

原文地址:https://www.cnblogs.com/chickenwrap/p/10182820.html