红配绿，黑与白？什么样的配色才能俘获审稿人的芳心？|彩虹|深蓝色|粉色|视觉|配色|黑与白

作为一名刚入行科研不久的小编

平时大量的时间花费在了阅读文献上

有些文献排版美观赏心悦目

有些则是惨不忍睹

不由道一声审稿人辛苦

作为论文的灵魂

图片永远是第一关注点

也往往是视觉的重灾区

有的图片深谙我国传统文化

红配绿将喜庆带在身上

有的图片则狠狠地考验读者眼力

几根数据线交叉又撞色

带读者们玩顺藤摸瓜的游戏

也有很多图片选择了中规中矩的彩虹配色

但效果并不理想

不局限于科研领域

在大众与科学界的交流中

图片也是信息的重要载体

你可能不会去关心黑洞成像复杂的建模公式

但你一定对黑洞的照片印象深刻

你可能不会去关心天气预报系统背后的机制

但你一定看过气温的分布图

M87黑洞照片 | 来源：参考资料1

全国气温分布图 | 来源：天气预报_气温预报 (nmc.cn)

好的科研绘图配色令人印象深刻

也能更准确地传递数据信息

今天小编就带大家看一下

怎样去选择最适合自己数据

能够轻松俘获审稿人芳心的

科研绘图配色

拒绝彩虹配色

最早使用彩虹配色（rainbow-like colour）的地方已经很难考据了，但彩虹配色无疑是科研绘图中最常见的配色之一。所谓的彩虹配色就是类似彩虹，赤橙黄绿蓝靛紫序列分布颜色。

彩虹配色 | 来源：参考资料3

在人眼中有两种类型的感光细胞，一种是视杆细胞，对光强度的变化敏感，负责黑白视觉；另一种是视锥细胞，对光强度不敏感，但是可以分为三种，分别对三种不同频率的光敏感，负责亮视觉以及认知颜色。三种视锥细胞配合，使得人们能够通过识别不同颜色完成对信息的认知。彩虹配色的每种颜色饱和度较高，亮度也很高，对人具有极强的视觉吸引力。

再加上大多数的绘图软件，如Matlab、Paraview等，都将彩虹配色设置为了默认配色，不科学的彩虹配色在很长一段时间内得到了广泛地应用。

为什么说彩虹配色不科学呢？主要原因有三。

颜色不遵循自然感知排序

什么叫不遵循自然感知排序呢？简单来说就是数值大的应该更明显，更亮，让人眼先识别到；数值小的后识别。对人眼识别来说相对亮的颜色更容易识别，但是彩虹配色中颜色的亮度都很高，在我们的视觉系统中无法做到有序感知，这会导致视觉的混乱。下图中左边颜色的亮度都很高，相对于右边的配色左边的彩虹配色更难区分值的大小分布。

彩虹配色（左）与科学配色（右）对比 | 来源：参考资料3

感知变化不均匀

在数据变化时，人眼对颜色的识别应该也相应地发生变化，这样才能较好地反映真实数据情况。但是彩虹配色在青色和黄色区域变化较快，而在蓝色、绿色以及红色区域变化较慢，这就会导致人们从颜色中获得错误的数据信息。

以下图为例，左图为灵敏度函数图的真实分布，右图为采用了彩虹配色后的灵敏度函数图。经过对比我们可以发现，在图片上半部低对比度区域，彩虹配色的颜色变化不明显，而在高对比度的下半部，颜色变化又过于尖锐不够平滑。

灵敏度函数图的灰度图与彩虹配色图 | 来源：参考资料3

再看月球表面形貌图，a是彩虹配色图（jet），b则是采用了turku配色的图片。同样的在彩虹配色图中相当一部分的陨石坑形貌难以看到，一部分起伏形貌区域的变化也被夸大或缩小，产生了失真。

月球形貌图。a. jet; b. turku. | 来源：参考资料4

对视觉缺陷不友好

研究数据显示世界上约有0.5%的女性以及8%的男性患有色觉缺陷（colour-vision deficiency，CVD）。彩虹配色对于这部分人群十分不友好。

配色类与型

其实从上面对彩虹配色的分析中就能看出来，一个好的、科学的配色应该是什么样的，它应该满足三方面的要求：感知颜色顺序（遵循自然感知排序）、感知一致性（感知变化均匀）以及普遍可读性（视觉缺陷友好）。

在绘制地图（map）型数据图时，为了实现最佳的数据表示，让配色有效地传达底层数据及其性质，需要根据情况选择适当的地图种类以及类型（classes and types）。

彩色地图的类与型以及相应的推荐配色 | 来源：参考文献4

Classes

彩色地图可分为四个主要类别，顺序类（sequential）、发散类（diverging）、多序类（multi-sequential）以及循环类（cyclic）。

对于没有特殊点的顺序数据，顺序类最为合适。顺序类具有一般性特点，能满足大部分数据集的绘图需求，也推荐将绘图软件中的默认地图配色设置为顺序配色，例如 batlow 。为了突显极值，在浅色背景下，应选用较暗的一端(例如 batlow 的深蓝色一端)代表最大值；在深色背景下则正相反，需要使用浅色(例如，batlow 的浅粉色末端)来突出最高值。

发散类适合表示包含偏离中心值的数据点的数据集，也称双峰数据集。发散类的焦点可以是两边的极值，也可以是中心值。还记得开头展示的气温分布图吗？这就是发散类的一个例子。roma 就是一种发散类配色，这类配色需要将色条的中心与数据的中间值对应，例如将气温的中间值与色条中心的颜色对应。为了突显极值，浅色背景选择两端暗色的配色（如roma），深色背景则选择两端浅色的配色（如berlin）。

气温分布图图例，极高温和极低温分别用深红和深蓝色表示，居中的温度则用浅色表示

多序类是一种特殊的类别，必须仔细调整以适应原始数据。多序类由两个或多个相邻排列的顺序类组成。类似于发散类，但几个部分的亮度增加是相同的方向。与发散类一样，多序类的中间点需要进行调整以对应数据集中的中间值。oleron 便是一种多序类配色。

oleron 配色下的地球形貌图。蓝色部分代表海洋地形，绿褐色部分代表陆地地形，白色作为过渡代表海平面。| 来源：参考资料4

循环类可以用来显示周期性的数据集，比如达尔文火山表面在给定时间内的隆起。它没有开始和结束，一般不需要对数据做过多调整，也是比较通用的一种类型。romaO 便是一种循环类配色。

达尔文火山表面在给定时间内的隆起 | 来源：参考资料4

Types

彩色地图可以进一步分为连续型（Continuous）、离散型（Discrete）以及分类型（Categorical）。其中连续型和离散型较好理解，表现在配色上便是颜色变化是连续的还是离散的。通常具有科学性的连续型配色会使用256种颜色，例如 batlow；离散型配色则有可以选用10、25、50或者100种颜色，batlow10便是选用了10种颜色。在使用离散型配色时，需要将彼此接近的点用统一颜色表示，因此需要恰当地选择颜色数量，避免降低数据表示的准确性。离散型与连续型的区别就在于颜色数量的不同。

batlow 与 batlow10

分类型是一种比较特殊的类型，其特点是不需要考虑数据的有序性以及变化特点，旨在显示单独的数据点。因为这种特性，分类型几乎适用于所有的作图，但却很难找到符合科学性要求的配色方案，目前仅有batlows 供大家参考。

batlows

选配色思路

针对配色的选择问题，Crameri等人给出了一般思路。在拿到要绘图的数据之后，我们只需要问自己这样几个问题：

1. 数据有序吗？

2. 数据有中间值吗？

3. 中间值与数据的序有关吗？

4. 小的波动是否重要？

5. 数据是否有空值？

6. 数据是否有直觉上适用的颜色？（比如气温用红蓝色）

7. 背景色选取是否正确？

参照下图的导引，问清自己这几个问题之后，配色的选择便不再是问题。

参考资料：

Akiyama, K. et al. First M87 event horizon telescope results. IV. Imaging the central supermassive black hole. Astrophys. J. Lett. 875, L4 (2019).
人眼对光的感知 - 知乎 (zhihu.com)
https://blog.csdn.net/dsfsdffgfd/article/details/90210806
Crameri, F., Shephard, G.E. & Heron, P.J. The misuse of colour in science communication. Nat Commun 11, 5444 (2020).

编辑：乐子超人

10.