字号
字号 标准
为什么:关于因果关系的新科学


【书 名】为什么:关于因果关系的新科学 

【作 者】(美)朱迪亚·珀尔, 达纳·麦肯齐 著    

【出版者】中信出版集团

【索书号】O14/1627

阅览室花津校区自然科学阅览室


作者简介

朱迪亚·珀尓(Judea Pearl)

加州大学洛杉矶分校计算机科学教授,“贝叶斯网络”之父,2011年因创立因果推理演算法获得图灵奖,同时也是美国国家科学院院士,IEEE智能系统名人堂第一批10位入选者之一。

目前已出版3本关于因果关系科学的经典著作,分别为《启发法》(1984)、《智能系统中的概率推理》(1988)和《因果论:模型、论证、推理 》(2009)。他还获得过多项科学荣誉,包括认知科学领域的鲁梅哈特奖、物理学及技术领域的富兰克林奖章以及科学哲学领域的拉卡托斯奖。

达纳·麦肯齐(Dana Mackenzie)

普林斯顿大学数学博士,自由科学记者,知名科普作家,著有《无言的宇宙》等作品,其学术论文多次收录于《科学》《新科学家》《科学美国》《探索》等重量级期刊。

内容简介

在本书中,人工智能领域的专家朱迪亚·珀尔及其同事领导的因果关系革命突破多年的迷雾,厘清了知识的本质,确立了因果关系研究在科学探索中的核心地位。

而因果关系科学真正重要的应用则体现在人工智能领域。作者在本书中回答的核心问题是:如何让智能机器像人一样思考?换言之,“强人工智能”可以实现吗?借助因果关系之梯的三个层级逐步深入地揭示因果推理的本质,并据此构建出相应的自动化处理工具和数学分析范式,作者给出了一个肯定的答案。作者认为,今天为我们所熟知的大部分机器学习技术,都建基于相关关系,而非因果关系。要实现强人工智能,乃至将智能机器转变为具有道德意识的有机体,我们就必须让机器学会问“为什么”,也就是要让机器学会因果推理,理解因果关系。或许,这正是我们能对准备接管我们未来生活的智能机器所做的有意义的工作。


思维胜于数据

每一门蒸蒸日上的科学都是在其符号系统的基础上繁荣发展起来的。

—— 奥古斯都·德·摩根(1864)

本书将要讲述的故事会围绕一门科学展开,这门科学改变了我们区分事实与虚构的方式,但目前,它仍处于大众的视野之外。这门新科学非常重要,其已经影响到了日常生活的种种重要的方面,并且还有可能进一步扩大影响范围,覆盖从新药开发到经济政策制定,从教育和机器技术人到枪支管制乃至全球变暖等重大问题的探索和解决。值得注意的是,尽管这些问题涉猎的领域广泛多元并且完全不具可比性,但这门新科学仍然成功将它们全部纳入一个统一的框架,这在20年前是根本不可能实现的。

这门新科学并没有一个时髦的名字,和我的许多同事一样,我简单地称之为“因果推断”。它本身也并不是什么高科技。因果推断力图模拟的理想技术就存在于我们人类自身的意识之中。数万年前,人类开始意识到某些事会导致其他事的发生,并且改变前者就会导致后者的改变。没有其他物种领悟到了这一点,更别说达到我们所理解的这种程度。由这一发现,人类这一物种创造出了有组织的社会,继而又建立了乡村和城镇,直至创建了我们今天所享有的科技文明。所有这一切都源于我们的祖先提出了这样一个简单的问题:为什么?

因果推断正是关于这个问题的严肃思考。它假设人类大脑是大自然有史以来为处理因果知识而设计出的最先进的工具。我们的大脑存储了海量的因果知识,而在数据的辅助下,我们可以利用这些知识解决当代社会所面临的最紧迫的问题。一个更宏伟的目标是,一旦我们真正理解了因果思维背后的逻辑,我们就可以在现代计算机上模拟它,进而创造出一个“人工科学家”。这个智能机器人将会为我们发现未知的现象,解开悬而未决的科学之谜,设计新的实验,并不断从环境中提取更多的因果知识。

但在冒险推测未来发展之前,了解迄今为止因果推断这门科学所取得的成就至关重要。我们将深入探讨它是如何改变了几乎所有依赖数据信息的学科中研究者的思维模式,以及它将如何改变我们的生活。

这门新科学解决了以下这些看似简单明了的问题:

一种特定的疗法在预防某类疾病方面的成效如何?

是新税法的颁布还是层出不穷的广告推销活动导致了销售额的增长?

由肥胖引发的医疗保健成本增长的总体占比为何?

雇用记录可否证明雇主实施了涉及性别歧视的招聘政策?

我打算辞掉工作。我究竟该不该这么做?

这些问题的共同点在于它们都与因果关系有关,我们可以通过诸如“预防”、“导致”、“由……引发”、“证明”和“该不该”这样的词语轻易识别出它们。这些词在日常生活用语中很常见,我们的社会也一直在不断提出这样的问题并寻求答案。然而,就在不久之前,我们甚至还无法在科学的范围内找到途径明确地表述这些问题,更别说回答它们了。

到目前为止,因果推断对人类最重要的贡献就是让这个科学盲点变成了历史。这门新科学催生出了一种简单的数学语言,用以表达我们已知和欲知的因果关系。以数学形式表达因果关系的能力让我们得以开发出许多强大的、条理化的方法,将我们的知识与数据结合起来,并最终回答出如上述那5个涉及因果关系的问题。

过去的25年,我有幸成为参与了这一科学发展进程中的一员。在公众的视野之外,我曾目睹过它在学生宿舍和研究实验室中崭露头角,也曾听到过在严肃的科学会议中它的突破性进展所引发的共鸣。眼下,随着我们进入强人工智能(AI)时代,越来越多的人开始鼓吹大数据和深度学习 的无尽可能性,这使我越发感觉到,向读者展示这门新科学正在进行的大胆探索,其对于数据科学以及人类在21世纪的生活所可能造成的诸多影响是恰逢其时且激动人心的。

我知道,当听到我把这些成就描述为一门“新科学”时,你可能会心存疑虑。你甚至可能会问,为什么科学家没有在更早的时间就开始这样做?比如在古罗马诗人维吉尔首次宣称“幸运儿乃是能理解众事原委之人”(公元前29年)的时候,或者,在现代统计学的奠基人弗朗西斯·高尔顿(Francis Galton)和卡尔·皮尔逊(Karl Pearson)首次发现人口统计数据可以揭示一些科学问题的答案的时候。在这些关键性的时间节点上,他们很遗憾地与因果关系失之交臂,这背后的曲折故事我将在本书的有关因果推断的历史渊源的章节中一一道来。在我看来,阻碍因果推断这一科学产生的最大障碍,是我们用以提出因果问题的词汇和我们用以交流科学理论的传统词汇之间的鸿沟。

为了说明这一鸿沟的深度,不妨设想一下科学家在尝试表达一些明显的因果关系时所面临的困难——举个例子,气压计读数 B 可以用来表示实际的大气压 P。我们可以轻而易举地用方程式来表示这种关系,B=kP,其中 k 是某个比例常数。如今,代数规则能让我们以多种形式书写这个方程,例如,P=B/k,k=B/P,或者 B-kP=0。它们意义相同,即如果知道方程中的三个量中的任意两个,那么第三个量即是确定的。字母 k、B 或 P 三者中的任意一个在数学上都没有凌驾于其他两个之上的特权。那么,我们怎样才能表达这个确凿无疑的事实,即,是大气压导致了气压计读书的变化,而不是反过来呢?倘若连这一事实都无法表达,我们又怎能奢望去表达其他许多无法用数学公式来表达的因果推断,例如鸡打鸣不会导致太阳升起?

我的大学教授们就没能做到这件事,也从没有为此抱怨过。我敢打赌,你们的教授中也没人研究过这个问题。现在,我们已经明白原因为何了:他们从未见识过一种关于因果的数学语言,也从未发现到它的好处。这种语言的发展被好几代科学家所漠视,其实质是科学的一种衰败。众所周知,按动开关按钮会导致一盏灯的打开或关闭,夏日午后的闷热空气会促使当地冰淇淋店的销售额增加。那么,为什么科学家们没有像用公式表达光学、力学或几何学的基本法则那样,用公式去捕捉这些显而易见的事实?为什么他们容忍这些事实在原始的直觉中凝滞,而不去运用那些促使其他科学分支走向繁荣和成熟的数学工具呢?

答案部分在于,科学工具的开发是为了满足科学需要。正因为开关、冰淇淋和气压计这类问题我们处理起来驾轻就熟,所以用特殊的数学工具来解决它们的意愿始终不够强烈。但随着人类求知欲的不断增强,以及社会现实开始要求人们讨论在复杂的法律、商业、医疗和决策情境中出现的因果问题,我们终于发现我们缺少一门成熟的科学所应提供的用于回答这些问题的工具和原理。

字号设置
标准