作为一名刚入行科研不久的小编

平时大量的时间花费在了阅读文献上

有些文献排版美观赏心悦目

有些则是惨不忍睹

不由道一声审稿人辛苦

作为论文的灵魂

图片永远是第一关注点

也往往是视觉的重灾区

有的图片深谙我国传统文化

红配绿将喜庆带在身上

有的图片则狠狠地考验读者眼力

几根数据线交叉又撞色

带读者们玩顺藤摸瓜的游戏

也有很多图片选择了中规中矩的彩虹配色

但效果并不理想

不局限于科研领域

在大众与科学界的交流中

图片也是信息的重要载体

你可能不会去关心黑洞成像复杂的建模公式

但你一定对黑洞的照片印象深刻

你可能不会去关心天气预报系统背后的机制

但你一定看过气温的分布图

M87黑洞照片 | 来源:参考资料1

全国气温分布图 | 来源:天气预报_气温预报 (nmc.cn)

好的科研绘图配色令人印象深刻

也能更准确地传递数据信息

今天小编就带大家看一下

怎样去选择最适合自己数据

能够轻松俘获审稿人芳心的

科研绘图配色

01

拒绝彩虹配色

最早使用彩虹配色(rainbow-like colour)的地方已经很难考据了,但彩虹配色无疑是科研绘图中最常见的配色之一。所谓的彩虹配色就是类似彩虹,赤橙黄绿蓝靛紫序列分布颜色。

彩虹配色 | 来源:参考资料3

在人眼中有两种类型的感光细胞,一种是视杆细胞,对光强度的变化敏感,负责黑白视觉;另一种是视锥细胞,对光强度不敏感,但是可以分为三种,分别对三种不同频率的光敏感,负责亮视觉以及认知颜色。三种视锥细胞配合,使得人们能够通过识别不同颜色完成对信息的认知。彩虹配色的每种颜色饱和度较高,亮度也很高,对人具有极强的视觉吸引力。

再加上大多数的绘图软件,如Matlab、Paraview等,都将彩虹配色设置为了默认配色,不科学的彩虹配色在很长一段时间内得到了广泛地应用。

为什么说彩虹配色不科学呢?主要原因有三。

1

颜色不遵循自然感知排序

什么叫不遵循自然感知排序呢?简单来说就是数值大的应该更明显,更亮,让人眼先识别到;数值小的后识别。对人眼识别来说相对亮的颜色更容易识别,但是彩虹配色中颜色的亮度都很高,在我们的视觉系统中无法做到有序感知,这会导致视觉的混乱。下图中左边颜色的亮度都很高,相对于右边的配色左边的彩虹配色更难区分值的大小分布

彩虹配色(左)与科学配色(右)对比 | 来源:参考资料3

2

感知变化不均匀

在数据变化时,人眼对颜色的识别应该也相应地发生变化,这样才能较好地反映真实数据情况。但是彩虹配色在青色和黄色区域变化较快,而在蓝色、绿色以及红色区域变化较慢,这就会导致人们从颜色中获得错误的数据信息。

以下图为例,左图为灵敏度函数图的真实分布,右图为采用了彩虹配色后的灵敏度函数图。经过对比我们可以发现,在图片上半部低对比度区域,彩虹配色的颜色变化不明显,而在高对比度的下半部,颜色变化又过于尖锐不够平滑。

灵敏度函数图的灰度图与彩虹配色图 | 来源:参考资料3

再看月球表面形貌图,a是彩虹配色图(jet),b则是采用了turku配色的图片。同样的在彩虹配色图中相当一部分的陨石坑形貌难以看到,一部分起伏形貌区域的变化也被夸大或缩小,产生了失真。

月球形貌图。a. jet; b. turku. | 来源:参考资料4

3

对视觉缺陷不友好

研究数据显示世界上约有0.5%的女性以及8%的男性患有色觉缺陷(colour-vision deficiency,CVD)。彩虹配色对于这部分人群十分不友好。

02

配色类与型

其实从上面对彩虹配色的分析中就能看出来,一个好的、科学的配色应该是什么样的,它应该满足三方面的要求:感知颜色顺序(遵循自然感知排序)、感知一致性(感知变化均匀)以及普遍可读性(视觉缺陷友好)

在绘制地图(map)型数据图时,为了实现最佳的数据表示,让配色有效地传达底层数据及其性质,需要根据情况选择适当的地图种类以及类型(classes and types)

彩色地图的类与型以及相应的推荐配色 | 来源:参考文献4

1

Classes

彩色地图可分为四个主要类别,顺序类(sequential)、发散类(diverging)、多序类(multi-sequential)以及循环类(cyclic)

对于没有特殊点的顺序数据,顺序类最为合适。顺序类具有一般性特点,能满足大部分数据集的绘图需求,也推荐将绘图软件中的默认地图配色设置为顺序配色,例如 batlow 。为了突显极值在浅色背景下,应选用较暗的一端(例如 batlow 的深蓝色一端)代表最大值;在深色背景下则正相反,需要使用浅色(例如,batlow 的浅粉色末端)来突出最高值。

发散类适合表示包含偏离中心值的数据点的数据集,也称双峰数据集。发散类的焦点可以是两边的极值,也可以是中心值。还记得开头展示的气温分布图吗?这就是发散类的一个例子。roma 就是一种发散类配色,这类配色需要将色条的中心与数据的中间值对应,例如将气温的中间值与色条中心的颜色对应。为了突显极值,浅色背景选择两端暗色的配色(如roma),深色背景则选择两端浅色的配色(如berlin)。

气温分布图图例,极高温和极低温分别用深红和深蓝色表示,居中的温度则用浅色表示

多序类是一种特殊的类别,必须仔细调整以适应原始数据。多序类由两个或多个相邻排列的顺序类组成。类似于发散类,但几个部分的亮度增加是相同的方向。与发散类一样,多序类的中间点需要进行调整以对应数据集中的中间值。oleron 便是一种多序类配色。

oleron 配色下的地球形貌图。蓝色部分代表海洋地形,绿褐色部分代表陆地地形,白色作为过渡代表海平面。| 来源:参考资料4

循环类可以用来显示周期性的数据集,比如达尔文火山表面在给定时间内的隆起。它没有开始和结束,一般不需要对数据做过多调整,也是比较通用的一种类型。romaO 便是一种循环类配色。

达尔文火山表面在给定时间内的隆起 | 来源:参考资料4

2

Types

彩色地图可以进一步分为连续型(Continuous)、离散型(Discrete)以及分类型(Categorical)。其中连续型和离散型较好理解,表现在配色上便是颜色变化是连续的还是离散的。通常具有科学性的连续型配色会使用256种颜色,例如 batlow;离散型配色则有可以选用10、25、50或者100种颜色,batlow10便是选用了10种颜色。在使用离散型配色时,需要将彼此接近的点用统一颜色表示,因此需要恰当地选择颜色数量,避免降低数据表示的准确性。离散型与连续型的区别就在于颜色数量的不同

batlow 与 batlow10

分类型是一种比较特殊的类型,其特点是不需要考虑数据的有序性以及变化特点,旨在显示单独的数据点。因为这种特性,分类型几乎适用于所有的作图,但却很难找到符合科学性要求的配色方案,目前仅有batlows 供大家参考。

batlows

03

选配色思路

针对配色的选择问题,Crameri等人给出了一般思路。在拿到要绘图的数据之后,我们只需要问自己这样几个问题:

1. 数据有序吗?

2. 数据有中间值吗?

3. 中间值与数据的序有关吗?

4. 小的波动是否重要?

5. 数据是否有空值?

6. 数据是否有直觉上适用的颜色?(比如气温用红蓝色)

7. 背景色选取是否正确?

参照下图的导引,问清自己这几个问题之后,配色的选择便不再是问题。

参考资料:

  1. Akiyama, K. et al. First M87 event horizon telescope results. IV. Imaging the central supermassive black hole. Astrophys. J. Lett. 875, L4 (2019).

  2. 人眼对光的感知 - 知乎 (zhihu.com)

  3. https://blog.csdn.net/dsfsdffgfd/article/details/90210806

  4. Crameri, F., Shephard, G.E. & Heron, P.J. The misuse of colour in science communication. Nat Commun 11, 5444 (2020).

编辑:乐子超人

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.