数据可视化旨在通过图形化的手段清晰地展示数据,使用户能够更直观地洞察和解读信息。然而在实际应用中,偶尔会遇到极端数据值,这些值因其过大或过小而在图表中显得突兀,从而影响了整体的可视化效果和数据的传达效率。

如何妥善处理异常值,这里提供一个简易的处理方法。以下面这个简洁的数据为例:

其中有个值888,与其他值不是一个量级的,直接用这个数据来做个柱形图,看起来是这样的:

除了这个最大值,其他值基本看不出来了,效果非常糟糕。

面对这种情况,怎么处理呢?若希望其它值能显著的显示出来,一个有效的方法是将其数值适度调整,以减少与其它数据点的差距。为了实现这一目标,在维持其他数据点不变的前提下,可以通过调整度量值来改变异常数据的大小:

异常值处理 =

VAR A=CALCULATE([数据合计],TOPN(1,ALL('表'[类别]),[数据合计]))

VAR B=MAXX(FILTER(ALL('表'[类别]),[数据合计]

RETURN IF([数据合计]=A,B*3,[数据合计])

其中数据合计 = SUM('表'[数据])

这个度量值中,变量A计算的是最大值,也就是异常值;变量B计算的是第二大值,也就是除异常值之外的最大值。最终逻辑是,如果某个类别的数据等于最大值,让它返回第二大值的3倍,其他数据不变。换用这个度量值来做柱形图看看效果:

这样的图表看起来就更为合理了,它不仅能够有效地展示其他数据,同时也能确保异常值得到恰当的突出。

不过为了能显示异常值的真正数据,还需要对这个图表进行一下处理:

1、关闭Y轴

Y轴刻度是按照调整后的数据来显示的,已经不准确,建议直接关掉。

2、添加自定义数据标签

这是最关键的一步,因为有了自定义标签功能,才能够如此处理。

打开数据标签里面的自定义标签,用正常的数据作为柱形图的标签:

这样设置以后,效果如下:

这看起来就正常多了。

3、添加截断标识

为了更准确地展示C值的效果,我们将在图表中增加一个截断标识。具体操作是:插入一条直线,将其旋转30度,并设置为白色颜色。接着,根据柱状图的宽度调整直线的适当大小。

做出来一条线后,再复制出来相同的一条线,两条线放到C柱上:

这样做可以明确地突出最大值,并且在比较其他值时也不会忽视。

作为最后的步骤,如果担心在移动图表时截断标识可能会出现位置错乱,可以将图表先移动到最底层。然后选中柱状图和之前添加的两条直线,在“格式”菜单中选择“分组”:

经过这样的处理,截断标识已经与柱形图结合得更为紧密,无论图表如何移动,标识都不会出现位置偏移的问题。