200年前,数据可视化如何拯救成千上万人?

200年前,数据可视化如何拯救成千上万人?

本文作者:Murray Dick 演瑞

Murray Dick 是纽卡斯尔大学多媒体新闻学的讲师,并著有《信息图表:新闻和通讯中数据图形的历史》(The Infographic:A History of Data Graphics in News and Communications)一书,本文基于该书节选进行了翻译和相关背景补充:

如果有人问,当你只有一页纸或只能滑动一次鼠标,你要如何传递有说服力的故事或者信息?

先来看两幅图。

图片

图片

第一幅图来自华盛顿邮报,图片统计了 2000 年起校园枪击案的数量,每一个点代表 10 名遭受枪击案威胁的孩子。

第二幅图来自奥地利设计师 Herwig Scherabon。图中两座城市的矩形建筑物高度对应了每个区域的收入水平,清晰地展现了现代城市中的贫富差距。

两幅图都是借助数据可视化实现的优秀作品。

作为整个数据科学过程中的关键阶段之一,完成一副图片数据可视化,并不是高不可攀和陌生的东西,无论是否是数据行业从业者,在日常的工作和汇报当中,都不免会使用到各种图表来直观呈现数据。

对非数据行业从业者来说,它也不陌生。21 世纪的我们对这种曲线图早已司空见惯,它出现在证券大楼的屏幕上,红线绿线交缠;它出现在我们的调查问卷中,此涨彼伏。新冠疫情期间,我们几乎每天都在关注各种数据统计。

但鲜为人知的是,已在商业智能和数据新闻领域中普及开来的数据可视化,有着源远流长丰富而令人兴奋的悠久历史,也曾是一个相对模糊的领域。

比如说,在人类与疾病漫长的对抗史中,两个世纪前出现针对疫情数据的统计工作,并不是那么受到重视。但有两个人成为扭转这种趋势的关键力量。

一位是医疗统计数据先驱、现代流行病学之父威廉・法尔(William Farr) ;另一位则是护士节由来的源头、克里米亚战争 (1853 - 1856) 中的 “提灯女神” 弗洛伦斯・南丁格尔(Florence Nightingale)。

图片

《东方军队死亡原因图》-- 摘自《俄罗斯后期战争期间对英军卫生史的贡献》一文,弗洛伦斯・南丁格尔(Florence Nightingale)著 | 图片来源:Wellcome Collection。

早期公共卫生可视化的先驱

19 世纪 30 年代的英国,正值工业革命奏响高潮之时。这个国家的社会关系和社会结构,也因迅猛发展的生产力而处于剧烈动荡的阶段。

社会大变革和利益再分配,让一些来自不同商业和专业阶层的自由派、改革派人士汇集在一起,从事统计研究工作。几年之内,在首都和北方重点工业城市中,形成了一系列学会,用统计学方法研究与各自成员的利益和兴趣相关的内容。

其中,随着工业化的副反应不断显现出来,农民蜂拥至城市和城镇寻找工作,在阁楼或地窖里寻找避难所,十几人挤在一个房间,几乎没有卫生设施。工厂的烟雾污染了空气。经济繁荣和低阶层工人的生活却形成极大反差。工人阶级里污秽、贫穷和苦难成风,而公民卫生运动却处于最低潮。卫生问题成为各个学会关注的首要问题。

一方面,正如医学史专家约翰・埃勒(John Eyler)在《维多利亚社会医学》一书中所说,卫生问题是 “工人阶级福祉的基本组成部分”,另一方面,有关卫生的数据相对容易获取。

1840 年代,在这些学会兴起的同时,出版革命也广泛兴起。新的通信和印刷技术降低了传播成本,也提高了印刷品质量,为早期公共卫生可视化创造了前提。原因在于卫生是工人阶级福祉的基本组成部分。

威廉・法尔便是关注这一卫生问题的人之一。作为现代医学统计学和流行病学的奠基人之一,事实上,他的职业生涯始于医学新闻而非临床实践,这反而巩固了他生命统计学专家的声誉。

法尔曾经试图通过一系列公共健康讲座传达自己的卫生思想,唤醒昏睡的当权者。由于经费不足,讲座失败,这却是他成为一名改革家的开始。他深信疾病预防比治愈更容易,健康是能够促进的。

1837 年英国登记总局(GRO)成立之后,第一波统计学浪潮便是将统计学应用到贫困问题和贫困者生活环境研究中。

怀揣如此抱负,1839 年法尔加 GRO,作为核心成员直至退休。

这期间,法尔也是医学期刊《柳叶刀》的定期撰稿人,秉持自由改革精神与专业统计学家操守。和当代统计学会中的许多同辈一样,他努力地在意识形态倾向和客观的统计学研究之间寻求平衡。

法尔的具体工作是负责记录全市的出生、结婚和死亡情况,定期作成表格向当局报告。进行英国人口普查时,他创造出了世界上最好的官方生命统计系统,并发展出描述疾病分布和影响因素的研究方法,可以精确地统计人口死亡原因,从而推动公共健康改善工作。

而且他喜欢在 GRO 出版物中使用图表,这些图表本身虽然并不是创新性的,但效果惊人。他所统计的死亡原因也为不断发展的公共卫生运动提供了动力,包括限制鸦片的供应、重新审视城市发展和卫生之间的关系等。

在他的摘要报告(发表于《第五次年度报告》(1843 年))中,使用了三个折线图来将萨里、利物浦和大都会的死亡率并列,表明了分布范围内的死亡率差异之大。从利物浦的图表可以看出,那里一半的孩子在 6 岁之前就死了。之前认为城市的发展与环境的卫生程度一致的看法,由此受到了强烈的质疑。

图片

《英格兰和威尔士醉酒状况地理分布图》,摘自 J. Rowntree 和 A. Sherwell 的《节制问题与社会改革》,1899 年。

图片

图片:W.Farr,《英格兰和威尔士出生、死亡和婚姻登记的年度报告》,第五次报告(伦敦:H.M.S.O,1843 年),第 51 页。

最懂数据分析的护士

相比威廉・法尔,弗洛伦斯・南丁格尔(Florence Nightingale)可能是一个你更加熟悉的名字。

每一年的护士节,便是为了纪念这位近代护理学及护理教育的创始人。

在 1854 年到 1856 年的克里米亚战争中,她率领 38 名护士赴前线参加伤病员护理工作,建立了医院管理员制度,提高护理品质,使伤病员死亡率得到迅速下降。1860 年她在伦敦创建了英国第一所护士学校,使护理事业逐步走向专业化、科学化。但鲜为人知的是,这期间她对于数据可视化的推动工作。

1854 年 9 月,克里米亚战争爆发,《泰晤士报》的威廉・霍华德・罗素(William Howard Russell)从前线发回了一系列惊人的报道,在广大公众中引起了极大的不满,暴露了军队缺乏医疗准备和对伤者不善的问题。当时的战争部长被迫采取行动,要求南丁格尔在政府的资助下访问克里米亚的军队医院。

南丁格尔来到伊斯坦布尔 Scutari 军营医院,常常和受伤的士兵待在一起,媒体因此大加关注,她一时声名鹊起,《泰晤士报》称赞她为 “带来光明的女子”。南丁格尔虽然主要担任行政职务,但还是定期拜访病房,在士兵中产生了浓厚的感情。

1858 年 3 月,为了提高政府对军队卫生问题的注意,也为了让她的建议得到落实,南丁格尔发起了一个媒体运动。她确定了一些可以为她发布文章的编辑,把他们的名字提供给委员会成员(同时也是她的密友)悉尼・赫伯特,然后向这些编辑投稿。她将投稿的重点放在季刊和评论上,当时季刊和评论的社会声誉要高于任何一份日报。南丁格尔制作了个性化的 “新闻资料袋”,其中包括 “概述,事实,甚至所有文章的标题”,并以匿名方式发布。

南丁格尔和法尔都有着一个共同信仰:两人都致力于统计学研究,试图揭开人类行为中隐藏的自然法则。他们认为,如果人类揭开了这项法则,就会更好地适应这个社会,从而逐步地提升人类群体的生存状态。

这种想法源于阿道夫・奎特莱特(Adolphe Quetelet)。1831 年,奎特莱特在法国发布了财产犯罪的分布图,以支撑他的观点,即无论人类社会如何发展,犯罪都遵守自然法则,并且随着社会不平等程度的增加而增加。Quetelet 的方法是经验性的、实践性的,并且基于统计学查询。后来,他撰写了第一本将统计学方法应用于社会问题研究的著作 ——《社会学与人文科学》(1835 年),这本书对南丁格尔产生了非常重要的影响。其中系统性收集数据的方式,让她感受到一种思想的高潮。

对于南丁格尔来说,把统计学应用于公共事业是 “一种道德上义务、一种宗教义务”,是为了完成神的旨意。

南丁格尔敏锐地意识到了信息图表的修辞能力,甚至在统计学上获得了审美的享受。

这一点在南丁格尔《关于影响英军健康、效率和医院管理的事项的注意事项》(1858 年)的小书中体现得淋漓尽致。

她创造性地使用图表的方式来表示军队医院季节性的死亡率,对克里米亚军队医院恶劣的卫生条件做出了谴责,可预防疾病导致的死亡人数是战场上死亡人数的七倍,从而改变了当时包括维多利亚女王在内的高层人士的认知,导致他们做出医事改革的决策。

可视化领域的专家李・布拉瑟尔(Lee Brasseur)对南丁格尔的 16 页小册子《对英军卫生史的贡献》中出现的三幅图的视觉修辞做出了令人信服的评价。他认为,这本颇有影响力的简短小册子上的三联图表具有连贯的序列性的过程。

图片

《东方军队死亡原因图》,F Nightingale 著,摘自《俄罗斯后期战争期间对英军卫生史的贡献》(伦敦:约翰・W・帕克,1859 年)。图片来源:Wellcome Collection。

第一个标题为 “东部陆军死亡率图”,列出了战争第一年和第二年每月的军队死亡率。右侧的较大的图表关于第一年的死亡率,而虚线则将读者注意力转移到左侧的较小图表上,该图表涉及第二年的死亡率。每个图表中这些死亡率都与同心圆并置,以表示曼彻斯特(当时英格兰死亡率最高的城镇之一)的平均死亡率。

为了吸引观众反思造成这些差异的原因,第二张图表 “东部陆军死亡原因图” 使用了颜色协调的极区图,其中大多数死亡都是因为本可预防的疾病。

在确定了问题的严重性,并且研究了其中的原因后,南丁格尔列出了第三张图表 —— 列出了每月的死亡率,这是 1855 年 3 月以后在 Scutari 和 Kulali 军区医院取得的研究结果。总的来说,这三个图表做出了尖锐的视觉化的批判,指出在克里米亚前线许多不必要的死亡,军方是要负极大的责任的。

南丁格尔的极区图(或爆炸状饼图)源于威廉・普莱费尔(William Playfair)的创新,以一种非常有效的方式,发挥了威廉・普莱费尔的圆形图中的隐喻含义。但同样也归功于她的长期合作者威廉・法尔在早期出版物中关于圆形图的尝试。

这些图表超越了它们表面的统一性、连续性和连贯性,每个部分缩放比例的变化都暗示着一种不连续的感觉,但同时也体现了制图经验主义的精神,这种精神在 19 世纪更广泛的统计地图中得到了体现。

这种形式充满力量感、权威感和目的性,审视着当今的社会弊端。这本小册子是一种多模式的媒介,结合了高度负责的解释性话语元素,成为非常有说服力的话语工具。

事实上,南丁格尔对信息图表设计或 “统计美学” 有着天然的天赋,她的数据图表和书面修辞一样,都很有说服力。她认为图表形式可以让女王和公众在内的所有人都看懂。

遗憾的是,她的这些表格并没有得到广泛的传播,绝大部分都被埋没在长达数百页的政府报告中。

而且,南丁格尔可以算是一位富有激情的统计学家,但维多利亚女王时代的新闻界却对她报道甚少。南丁格尔和法尔的可视化图表有一些颇有地位的受众,但对公众而言,并没有什么直接的重大的影响。

直到 20 世纪初年历书流行,现代日报催生了英国出版业的繁荣,广大的公众才开始接触信息图表。除了公共卫生专家以外,越来越多的政府决策人士和普通大众,开始相信信息可以是必备的 “药物” 之一,知道哪些数据流可以帮助平息未来疫情的暴发。

References:
https://thereader.mitpress.mit.edu/history-of-early-public-health-infographics/

关于数据实战派

数据实战派希望用真实数据和行业实战案例,帮助读者提升业务能力,共建有趣的大数据社区。

图片

猜你喜欢

转载自blog.csdn.net/shujushizhanpai/article/details/112848065
今日推荐