为什么-关于因果关系的新科学 内容简介
在本书中,人工智能领域的**专家朱迪亚·珀尔及其同事领导的因果关系革命突破多年的迷雾,厘清了知识的本质,确立了因果关系研究在科学探索中的核心地位。
而因果关系科学真正重要的应用则体现在人工智能领域。作者在本书中回答的核心问题是:如何让智能机器像人一样思考?换言之,“强人工智能”可以实现吗?借助因果关系之梯的三个层级逐步深入地揭示因果推理的本质,并据此构建出相应的自动化处理工具和数学分析范式,作者给出了一个肯定的答案。作者认为,今天为我们所熟知的大部分机器学习技术,都建基于相关关系,而非因果关系。要实现强人工智能,乃至将智能机器转变为具有道德意识的有机体,我们就必须让机器学会问“为什么”,也就是要让机器学会因果推理,理解因果关系。或许,这正是我们能对准备接管我们未来生活的智能机器所做的*有意义的工作
为什么-关于因果关系的新科学为什么-关于因果关系的新科学 前言
前言
大约20年前,在为我的书《因果论》(Causality, 2000)作序时,我发表了一句颇为很大胆的定论,以致朋友们都劝我低调行事。“因果论经历了一次重大转变,”我写道,“从一个笼罩着神秘色彩的概念转变为一个具有明确语义和逻辑基础的数学对象。悖论和争议得以解决,模棱两可的概念得以阐明,那些依赖于因果信息、长期被认为是形而上的或无法解决的实际问题,现在已经可以借助初等数学加以解决了。简言之,因果论已经完成了数学化。”
如今读到这段话,我自觉当时还是有些短视了。我所描述的“转变”被证明是一场改变了诸多科学理念的“革命”,现在,很多人称之为“因果革命”,而它在学术圈激起的波澜正蔓延至教育和应用领域。我相信,眼下是向更多读者分享它的大好时机。
我在这本书中力图完成一个三位一体的使命:首先,用非数学的语言阐述因果革命的知识内涵,说明它将怎样影响我们的生活和未来。其次,分享在解决重要的因果问题时,我们的科学家前辈走过的英勇征程,无论成败,这些故事都值得讲述。
*后,回溯因果革命在人工智能领域的发源地,目的是向你介绍如何开发出用我们的母语——因果语言进行交流的机器人。新一代机器人应该能够向我们解释事情为何发生,为何以它们选择某种方式做出反应,以及大自然为何以这样而非那样的方式运作。一个更雄心勃勃的目标是,它们也应该能够让我们进一步认识人类自身:我们的思维为什么以这样的方式运行,以及理性思考原因和结果、信任和遗憾、目的和责任究竟意味着什么。
在我书写各种公式时,我很清楚我的读者是谁。但是当我为大众写作时,情况就不一样了——对我来说这是一次全新的冒险。这种新的体验很奇特,但它可以说是我生命中令我收获*大的一场自我教育之旅。我需要用读者的语言组织思路,猜测读者的背景、可能提出的问题和给出的反应,这让我比我在写作此书之前对所有那些公式的探索都更能加深我对因果论的理解。
为此,我将永远感激你,我的读者。我希望你能与我一样迫不及待地去寻求答案
为什么-关于因果关系的新科学 目录
推荐序
前言
导 言:思维胜于数据
**章:因果关系之梯
第二章:从海盗到豚鼠:因果推断的起源
第三章:从证据到因:当贝叶斯牧师遇见福尔摩斯先生
第四章:混杂和去混杂:或者,消灭潜伏变量
第五章:烟雾缭绕的争论:消除迷雾,澄清事实
第六章:大量的悖论!
第七章:超越调整:征服干预之峰
第八章:反事实:挖掘关于假如的世界
第九章:中介:寻找隐藏的作用机制
第十章:大数据,人工智能和大问题
致谢
参考文献
为什么-关于因果关系的新科学 节选
思维胜于数据
每一门蒸蒸日上的科学都是在其符号系统的基础上繁荣发展起来的。
—— 奥古斯都·德·摩根(1864)
本书将要讲述的故事会围绕一门科学展开,这门科学改变了我们区分事实与虚构的方式,但目前,它仍处于大众的视野之外。这门新科学非常重要,其已经影响到了日常生活的种种重要的方面,并且还有可能进一步扩大影响范围,覆盖从新药开发到经济政策制定,从教育和机器技术人到枪支管制乃至全球变暖等重大问题的探索和解决。值得注意的是,尽管这些问题涉猎的领域广泛多元并且完全不具可比性,但这门新科学仍然成功将它们全部纳入一个统一的框架,这在20年前是根本不可能实现的。
这门新科学并没有一个时髦的名字,和我的许多同事一样,我简单地称之为“因果推断”。它本身也并不是什么高科技。因果推断力图模拟的理想技术就存在于我们人类自身的意识之中。数万年前,人类开始意识到某些事会导致其他事的发生,并且改变前者就会导致后者的改变。没有其他物种领悟到了这一点,更别说达到我们所理解的这种程度。由这一发现,人类这一物种创造出了有组织的社会,继而又建立了乡村和城镇,直至创建了我们今天所享有的科技文明。所有这一切都源于我们的祖先提出了这样一个简单的问题:为什么?
因果推断正是关于这个问题的严肃思考。它假设人类大脑是大自然有史以来为处理因果知识而设计出的*先进的工具。我们的大脑存储了海量的因果知识,而在数据的辅助下,我们可以利用这些知识解决当代社会所面临的*紧迫的问题。一个更宏伟的目标是,一旦我们真正理解了因果思维背后的逻辑,我们就可以在现代计算机上模拟它,进而创造出一个“人工科学家”。这个智能机器人将会为我们发现未知的现象,解开悬而未决的科学之谜,设计新的实验,并不断从环境中提取更多的因果知识。
但在冒险推测未来发展之前,了解迄今为止因果推断这门科学所取得的成就至关重要。我们将深入探讨它是如何改变了几乎所有依赖数据信息的学科中研究者的思维模式,以及它将如何改变我们的生活。
这门新科学解决了以下这些看似简单明了的问题:
一种特定的疗法在预防某类疾病方面的成效如何?
是新税法的颁布还是层出不穷的广告推销活动导致了销售额的增长?
由肥胖引发的医疗保健成本增长的总体占比为何?
雇用记录可否证明雇主实施了涉及性别歧视的招聘政策?
我打算辞掉工作。我究竟该不该这么做?
这些问题的共同点在于它们都与因果关系有关,我们可以通过诸如“预防”、“导致”、“由……引发”、“证明”和“该不该”这样的词语轻易识别出它们。这些词在日常生活用语中很常见,我们的社会也一直在不断提出这样的问题并寻求答案。然而,就在不久之前,我们甚至还无法在科学的范围内找到途径明确地表述这些问题,更别说回答它们了。
到目前为止,因果推断对人类*重要的贡献就是让这个科学盲点变成了历史。这门新科学催生出了一种简单的数学语言,用以表达我们已知和欲知的因果关系。以数学形式表达因果关系的能力让我们得以开发出许多强大的、条理化的方法,将我们的知识与数据结合起来,并*终回答出如上述那5个涉及因果关系的问题。
过去的25年,我有幸成为参与了这一科学发展进程中的一员。在公众的视野之外,我曾目睹过它在学生宿舍和研究实验室中崭露头角,也曾听到过在严肃的科学会议中它的突破性进展所引发的共鸣。眼下,随着我们进入强人工智能(AI)时代,越来越多的人开始鼓吹大数据和深度学习 的无尽可能性,这使我越发感觉到,向读者展示这门新科学正在进行的大胆探索,其对于数据科学以及人类在21世纪的生活所可能造成的诸多影响是恰逢其时且激动人心的。
我知道,当听到我把这些成就描述为一门“新科学”时,你可能会心存疑虑。你甚至可能会问,为什么科学家没有在更早的时间就开始这样做?比如在古罗马诗人维吉尔首次宣称“幸运儿乃是能理解众事原委之人”(公元前29年)的时候,或者,在现代统计学的奠基人弗朗西斯·高尔顿(Francis Galton)和卡尔·皮尔逊(Karl Pearson)首次发现人口统计数据可以揭示一些科学问题的答案的时候。在这些关键性的时间节点上,他们很遗憾地与因果关系失之交臂,这背后的曲折故事我将在本书的有关因果推断的历史渊源的章节中一一道来。在我看来,阻碍因果推断这一科学产生的*大障碍,是我们用以提出因果问题的词汇和我们用以交流科学理论的传统词汇之间的鸿沟。
为了说明这一鸿沟的深度,不妨设想一下科学家在尝试表达一些明显的因果关系时所面临的困难——举个例子,气压计读数 B 可以用来表示实际的大气压 P。我们可以轻而易举地用方程式来表示这种关系,B=kP,其中 k 是某个比例常数。如今,代数规则能让我们以多种形式书写这个方程,例如,P=B/k,k=B/P,或者 B-kP=0。它们意义相同,即如果知道方程中的三个量中的任意两个,那么第三个量即是确定的。字母 k、B 或 P 三者中的任意一个在数学上都没有凌驾于其他两个之上的特权。那么,我们怎样才能表达这个确凿无疑的事实,即,是大气压导致了气压计读书的变化,而不是反过来呢?倘若连这一事实都无法表达,我们又怎能奢望去表达其他许多无法用数学公式来表达的因果推断,例如鸡打鸣不会导致太阳升起?
我的大学教授们就没能做到这件事,也从没有为此抱怨过。我敢打赌,你们的教授中也没人研究过这个问题。现在,我们已经明白原因为何了:他们从未见识过一种关于因果的数学语言,也从未发现到它的好处。这种语言的发展被好几代科学家所漠视,其实质是科学的一种衰败。众所周知,按动开关按钮会导致一盏灯的打开或关闭,夏日午后的闷热空气会促使当地冰淇淋店的销售额增加。那么,为什么科学家们没有像用公式表达光学、力学或几何学的基本法则那样,用公式去捕捉这些显而易见的事实?为什么他们容忍这些事实在原始的直觉中凝滞,而不去运用那些促使其他科学分支走向繁荣和成熟的数学工具呢?
答案部分在于,科学工具的开发是为了满足科学需要。正因为开关、冰淇淋和气压计这类问题我们处理起来驾轻就熟,所以用特殊的数学工具来解决它们的意愿始终不够强烈。但随着人类求知欲的不断增强,,以及社会现实开始要求人们讨论在复杂的法律、商业、医疗和决策情境中出现的因果问题,我们终于发现我们缺少一门成熟的科学所应提供的用于回答这些问题的工具和原理。
为什么-关于因果关系的新科学 相关资料
“你是否曾经对相关关系和因果关系的问题感到疑惑?这部内容精彩的著作对此问题给出了一个富有启发性的答案,且读来妙趣横生。”
——丹尼尔·卡尼曼,诺贝尔经济学奖得主,《思考,快与慢》作者
“在过去的30年间,珀尔所取得的成就为人工智能领域的进步提供了理论基础……他重新定义了‘思维机器’这一术语。”
——温顿·瑟夫,“互联网之父”之一,谷歌副总裁兼首席互联网专家,2004年图灵奖获得者
“如果因果关系不等于相关关系,那它是什么?感谢朱迪亚·珀尔划时代的研究成果,我们现在对这一问题有了精确的答案。如果你想要理解世界的运行方式,那么这本引入入胜、充满阅读乐趣的著作就是一个很好的起点。”
——佩德罗·多明戈斯,华盛顿大学计算机科学教授,《**算法》作者
“朱迪亚·珀尔一直是人工智能革命的心脏和灵魂,更广义地说,他是计算机科学革命的心脏和灵魂。”
——埃里克·霍维茨,微软研究实验室主任兼常务董事
“如果把一个学科的疆域比喻为一个不规则多边形,那么多边形的所有顶点就定义了这个学科的边界。这本书的内容代表人工智能学科在因果推理方面的一个‘顶点’。突破性创新必然发生在所有‘顶点’划定的学科边界之外,而‘热点’则往往在边界之内。不了解‘顶点’,就难以展开突破性创新。”
——陈小平,中国科学技术大学机器人实验室主任
“尤瓦尔·赫拉利在《人类简史》中指出,人类进化史上的**次认知革命以发展出“想象不存在的事物”的能力为标志,《为什么》一书则更进一步提出,正是在这一能力的基础之上,人类发展出了因果思维。从原始部落组织狩猎行动,到孟德尔的基因遗传特征分析,从吸烟是否致癌的争辩到强人工智能是否可能实现的大讨论,无一不需要因果思维的指引。”
——罗振宇,得到App创始人
“真正的人工智能必须拥有什么能力?珀尔认为,要实现人工智能,就必须让机器具备因果推断能力。珀尔只手推动了人工智能领域的因果革命,面向大众读者推出《为什么》一书,这是一部关于人工智能与因果推断的科普之作,也是一部哲学与科学交相辉映之作。珀尔将技术与思想融为一体,系统阐述了因果关系之梯的三个层级。毫无疑问,该书将和《自私的基因》一样成为我们这个时代的经典之作。”
——梅剑华,山西大学哲学社会学院教授,现代外国哲学学会理事
“人类本能地想要寻找事物之间的因果关系,却长久地陷于迷雾之中。珀尔的《为什么》和卡尼曼的《思考,快与慢》一样,也是石破天惊、开辟鸿蒙的巨作,这本书介绍了新兴的因果推断科学,直达人工智能学科的前沿。阅读这本书,不仅能拓宽你的思维广度,而且能增加你的思维维度。”
——-何帆,上海交通大学安泰经济与管理学院教授,《变量》作者
“颇具启发性……珀尔教授在《为什么》一书中将其对于发现因果关系这一新科学的喜悦以及对于他的学生和同事所做工作的自豪感完全体现了出来……这本书不仅为广大读者们上了关于科学思想发展史的宝贵一课,也为相关领域的从业人士提供了判断大数据是否能够给出有效解释的概念性工具。”
——《纽约时报》
“因果关系是科学界和医学界争论*激烈、*难证明的命题之一。这本书将引领你真正开始思考因果关系,因为它适用于解决我们当今时代的诸多问题,包括吸烟究竟是否会导致癌症,胆固醇水平与心脏病的关系,等等。两位作者细致入微地讲述了这些案例的来龙去脉,实在精彩。”
——“科学星期五”,**科学媒体
“‘相关关系不等于因果关系。’这一科学禁令已经为社会带来了严重的不良后果……朱迪亚·珀尔提出了一个革命性的数学解决方案……生物学、医学、社会科学和人工智能领域都因此获得了长足的发展。”
——《自然》杂志
为什么-关于因果关系的新科学 作者简介
朱迪亚·珀尓(Judea Pearl)
现加州大学洛杉矶分校计算机科学教授,“贝叶斯网络”之父,2011年因创立因果推理演算法获得图灵奖,同时也是美国国家科学院院士,IEEE智能系统名人堂第一批10位入选者之一。
目前已出版3本关于因果关系科学的经典著作,分别为《启发法》(1984)、《智能系统中的概率推理》(1988)和《因果论:模型、论证、推理 》(2009)。他还获得过多项**科学荣誉,包括认知科学领域的鲁梅哈特奖、物理学及技术领域的富兰克林奖章以及科学哲学领域的拉卡托斯奖。
达纳·麦肯齐(Dana Mackenzie)
普林斯顿大学数学博士,自由科学记者,知名科普作家,著有《无言的宇宙》等作品,其学术论文多次收录于《科学》《新科学家》《科学美国》《探索》等重量级期刊。