珍藏版 | 这 30 个细节,决定了数据可视化的质量

很多同学学习Python是为了做数据分析及数据可视化。不过要做好可视化,准确、直观地展现数据及规律,光掌握代码层面的技术还不够。

优秀的数据可视化图表不仅仅是简单地罗列、总结数据。数据可视化其真正的价值是设计出可以被读者轻松理解的数据展示,因此在设计过程中,每一个选择,最终都应落脚于读者的体验,而非图表制作者个人。

所以,今天我们抛开代码,仅就可视化图表设计层面,来分享一下前人总结的30个小技巧。通过列举一些容易被忽略的常见错误,最终能够快速提升和巩固你的可视化制作水平。

一、你不得不注意的图表制作小技巧

1.条形图的基线必须从零开始

条形图的原理就是通过比较条块的长度来比较值的大小。当基线被改变了,视觉效果也就扭曲了。

图片

2.使用简单易读的字体

有些时候,排版可以提升视觉效果,增加额外的情感和洞察力。但数据可视化不包括在内。坚持使用简单的无衬线字体(通常是Excel等程序中的默认字体)。无衬线字体即是那些文字边缘没有小脚的字体。

图片

3.条状图宽度适度

条形图之间的间隔应该是1/2栏宽度。

图片

4.使用2D图形

虽然他们看起来很酷,但是3d形状可以扭曲感知,因此扭曲数据。坚持2 次元,确保数据准确。

图片

5.使用表格数字字体

表格间距赋予所有的数字相同的宽度,使它们排列时能彼此对齐,使比较更容易。大多数流行字体都内置了表格。不确定字体是否正确?就看小数点(或任何数字)是否对齐就行。

图片

6.统一感

统一感使我们更容易接收信息:颜色,图像,风格,来源……

图片


很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:721195303


7.不要过分热衷于饼图

展示多个区块比例大小,所有区块(圆弧)的加和等于 100%。但最好避免使用这个图表,因为肉眼对面积大小不敏感。

图片

8.折线图中使用连贯的线条

虚线,虚线容易分散注意力。相反,使用实线和颜色,反而容易区分彼此的区别。

图片

9.尊重部分所占整体的比例

在人们多选的问题上就会出现比例的重叠,不同选项的百分比之和大于一。为了避免这种情况,不能直接把比例做成统计图。相较于呈现数值,有些图更着重于表现部分与整体的关系。

图片

10.面积、尺寸可视化

对同一类图形(例如柱状、圆环和蜘蛛图等)的长度、高度或面积加以区别,来清晰的表达不同指标对应的指标值之间的对比。制作这类数据可视化图形时,要用数学公式计算,来表达准确的尺度和比例。

图片

11.使用大小来可视化值

大小可以帮助强调重要信息并添加上下文提示,使用大小来表示值配合地图使用的效果也非常好。如果您的可视化中有多个大小相同的数据点,它们会混在一起,很难区分值。

图片

12.使用相同细节

添加的细节(和数字)越多,大脑处理的时间就越长。想想你想要用你的数据传达什么,以及最有效的方式是什么。

13.使用基础图形

一个很好的经验法则是,如果你不能高效理解,你的读者或听众可能也难理解。因此,坚持使用基础图形:直方图、条形图、维恩图、散点图和线形图。

图片

14.视图数量

将您的可视化中的视图数量限制为三到四个。如果您添加太多视图,大局会被详细信息所淹没。

二、关于图表配色,你可以参考的5条准则

1.颜色深浅

通过颜色的深浅来表达指标值的强弱和大小,是数据可视化设计的常用方法,用户一眼看上去便可整体的看出哪一部分指标的数据值更突出。

图片

2.使用同一色系

颜色用得太花,会给数据增加不可承受之重,相反,设计师应该采用同一色系,或者类比色。

图片

3.避免使用鲜艳的颜色

明亮鲜艳的颜色就像是把所有的字母都大写想要强调一样,你的听众感觉你在对他们大声推销。单调的颜色,反而能很好地用于数据可视化,因为它们可以让你的读者理解你的数据,而不至于被数据淹没。

图片

4.标签使用不同颜色区分

在某些情况下,在一段时间或一系列的值中,我们可能测量了不同种类的物体。例如,假设我们测量 6 个月以来狗和猫的体重。在实验结束时,我们想画出每只动物的体重,分别用蓝色和红色区分猫和狗。

图片

5.颜色数量

不要在一张图上使用6种以上的颜色。

图片

三、标准的可视化图表一定有注释

1.解释编码

通过一定的形状、颜色和几何图形的结合,将数据呈现出来。为了让读者能读清楚,图表设计者就要把这些图形解码回数据值。

2.轴标签

这可能看起来没有必要,或者不是很有帮助,但是你无法想象,如果你的图表有点混乱,或者看到数据的人对此不是很熟悉,你会被问多少次 x/y 轴代表的是什么。按照前面的两个绘图示例,如果要为轴设置特定名称。

3.标题

如果我们要将数据呈现给第三方,另一个基本但关键的要点是使用标题,它和之前的轴标记非常相似。

图片

4.重点元素做注释

通常情况下,仅仅在图表的左右两侧使用刻度本身并不是很清楚。在图上标注值对于解释图表非常有用。

图片

5.重要视图位置

将最重要的视图放置在顶部或左上角。眼睛通常会首先注意到该区域。

图片

四、优秀的可视化图表,遵守的6条原则

1.数据排序有序

数据类别按字母顺序,大小顺序,或价值进行排序,以一种合乎逻辑的和直观的方式来引导读者了解数据。

2.比较数据

比较是展示数据差异的好法子,但是如果你的读者不容易看出差别的话,那么你的比较就毫无意义。确保所有的数据都是呈现在读者面前,选择最合适的比较方法。

图片

3.不可扭曲数据

确保所有可视化方式是准确的。例如,气泡图大小应该根据区域扩展,而不是直径。

图片

4.展示数据

让读者看到数据,这是可视化的重点。确保没有数据丢失或被设计。例如,使用标准的面积图时,可以添加透明度,确保读者可以看到所有数据。

5.删除变量

很多时候,太多的信息会影响读者的注意,从可视化中删除隐含信息是一个好主意,在这种情况下,我认为我们不需要在轴中包含变量的名称。

6.避免数据噪音

把不重要的东西减到最少或者去掉。这包括减弱或移除图形线,改变轴线、图形线的颜色,以及用浅灰色描绘电子表格行。使得“数据比率”可以达到一个很高的水平,听众会更容易明白其中的数据情况。

图片

五、小结

良好的数据可视化应该通过使用图形,清晰有效地传达数据信息。最佳可视化使您可以轻松地一目了然地理解数据。他们将复杂的信息以一种简单的方式分解,使目标受众能够理解并以此为基础做出决策。

“设计的基本考验是它有助于理解内容,而不是它的时尚性。-- Edward R. Tufte”数据可视化尤其应该坚持这一理念。目标是通过设计增强数据,而不是引起对设计本身的关注。

俗话说熟能生巧,在每次数据可视化的制作过程中多思考一下,有哪些细节需要注意,这些细节的处理是否合理,相信你的数据可视化水平将会大大提升!

在这里还是要推荐下我自己建的Python学习群:721195303,群里都是学Python的,如果你想学或者正在学习Python ,欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2021最新的Python进阶资料和零基础教学,欢迎进阶中和对Python感兴趣的小伙伴加入!

猜你喜欢

转载自blog.csdn.net/aaahtml/article/details/112857334