科学的光荣,哲学的丑闻:怎么对付“归纳”带来的麻烦?

人工智能中的良多焦点问题起首需要一个得当的哲学解,然后是把这个哲学不雅点切确化的数学解,最后是把这个数学模子操作化的程序解。这三者缺一不成。

好比“机械进修发生成见”就源于练习数据的代表性,这其实是休谟问题的表示形式之一。注重到休谟问题会让您发现,概率统计到底能不克不及用不是很轻易能断定的。

撰文 | 王培(美国天普大学计较机与信息科学系)

归纳有理吗?

所谓“归纳”,指的是从个体事例到遍及归纳综合的推理过程,好比从对诸多乌鸦的不雅察中得出“全国乌鸦一般黑”的结论。与其相反的“演绎”推理则是从一般陈述到具体事例。在汗青上,对这些推理的研究是在两个层面长进行的。一个是个别层面,存眷一小我如何进行这些推理来获得常识。这是熟悉论、认贴心理学、逻辑学的焦点问题之一,尽管这些学科的思绪各有分歧。另一个是在群体层面,存眷在科学理论的构建和利用中如何进行这些推理。这是科学哲学、科学史等范畴研究的问题。尽管有各类细节上的不同,在这两个条理上的归纳及其与演绎的关系仍有底子上的同质性,所以下面我会一路会商。

因为经验科学往往是从不雅察到的具表现象出发,逐渐归纳综合、抽象到一般性理论,这一过程很天然地会被算作是个归纳过程。培根(Francis Bacon,1561-1626)、穆勒(John Stuart Mill,1806-1873)等哲学家就曾试图清算出一套 “归纳逻辑” 或 “科学归纳法”,认为经由过程系统地收集和清算不雅察材料,然后对假说进行评价和筛选,就可以获得靠得住的科学理论。其实至今大部门科学家根基上仍是遵循近似的方式,尽管他们往往将其看作不移至理,不需要专门拿出来会商的。

1ad5ad6eddc451dae5795f62b8fd5266d11632af.jpg

粉碎了这一派承平气象的是休谟(David Hume,1711-1776)。他指出既然归纳是从已知事例中归纳综合出一般结论,那就是一种“扩大常识的推理”,因为结论也包罗了将来事例,所以超出了曩昔已知的规模。除非将来和曩昔是一样的,这种结论就不克不及包管准确。但怎么证实将来和曩昔一样呢?归纳证实会导致轮回论证,更不必说有人会认为将来和曩昔原本就不会完全一样。休谟认为归纳只是一种心理习惯,就是说我们简直都这么想,但这种思维体例并没有理性根本,是以不这么想也不克不及算错。

休谟的论证总让我想起鲁迅《狂人日志》里的诘责:“从来如斯,便对么?” 当然狂人的“对”说的是伦理,而休谟说的是逻辑,但二人的问题和获得的反映都差不多。学者们感觉休谟的论证难以辩驳,但又毫不能接管,因为这样一来常识和科学理论的合理性就都朝了。给他贴一个“不成知论者”的标签和叫一小我“疯子”的启事近似吧。科学取得的当作就有目共睹,这时辰说其焦点法则没有事理可言只是习惯罢了,这不是脑子有弊端吗?

既然归纳的合理性难以论证,天然有人会为科学另找依据。波普尔(Karl Popper,1902-1994)写了一本《科学发现的逻辑》,其本家儿要结论倒是科学假说的发现不合适任何逻辑,而逻辑的感化只是对假说进行证伪。所谓的“科学理论”只不外是尚未被证伪的假说罢了。这个结论影响很大,在挑战良多自称“科学”的学说时堪称利器,但良多人感觉把归纳完全扫地出门似乎过度了。归纳被称为“科学的名誉,哲学的丑闻”就是这个缘故:明明是个好工具,就是说不清事理安在。

黑乌鸦和黑绵羊的疑案

我猜读到此处,有些读者已经在心里念叨了:哲学家就是没事谋事。好用就行了呗,刨根问底干什么!我这里就呼唤两只黑色的神兽,用它们的力量来申明归纳里面的麻烦远不是把哲学家们都封口就完事了。

作为对休谟和波普尔的回应,良多人指出归纳结论的准确性不应被算作绝对的真或伪,而是个水平问题。归纳就是按照证据增添或削减对一个陈述的相信水平。好比说对“乌鸦是黑的”这个陈述,每当我们看到一只黑乌鸦,我们对这个陈述的相信水平会上升,而若是看到一只白乌鸦,相信水平会下降。这就是说,对“是A就是B”这种陈述而言,每当我们看到A的一个实例,若是它也是B,它就是陈述的正例,不然就是反例,而相信水平会响应被调整。

到此为止似乎没弊端,但亨普尔(Carl Gustav Hempel,1905-1997)发现了一个问题:按照经典逻辑,陈述“是A就是B“ 和它的逆否陈述“不是B就不是A”等价,即说的是一回事。那就是说这两个陈述的正、反例是一样的。一个红苹果既不是黑的也不是乌鸦,所以它就是“不是黑的就不是乌鸦”的正例,是以也就是“乌鸦是黑的”的正例。这就是说每当您看见一个红苹果,您对“乌鸦是黑的”的相信水平就应该增添。这就是有名的“亨普尔悖论”,又称“乌鸦悖论”。您若是感觉这还不敷怪,那您必然是个哲学家,因为亨普尔本人就建议我们接管这个听起来怪怪的成果,不然的话我们就要挑战逻辑等价性尺度,那后果就更严重了。但即使我们硬着头皮认可红苹果简直应该使我们加倍相信“乌鸦是黑的”,那怪事也没有完,因为按照同样的来由,我们同时应该加倍相信“乌鸦是白的”,“乌鸦是金子做的”,“天是蓝的”,等等。奇奥吧?

若是黑乌鸦带来的霉气还几多可以赖到哲学家头上,那下面的黑绵羊就完全没法让他们背锅了。一个出处不详的笑话说一位天文学家、一位物理学家和一位数学家坐火车进入苏格兰后,在窗外见到一只黑色的绵羊。天文学家说:“苏格兰的绵羊是黑的!” 物理学家改正说:“应该说有一些苏格兰绵羊是黑的。”这时数学家说:“您们都错了。准确的说法是:在苏格兰,至少有一只绵羊,且这只绵羊至少有一面看起來是黑的。” 这个笑话八当作是物理学家们编出来嘲讽天文学家的不严谨和数学家的过度严谨,但它同时展示了归纳的另一个麻烦:即使是对统一个不雅察成果来说,也存在多种归纳综合的可能性。

好比说对上面的场景,归纳结论“苏格兰的绵羊是黑的”“欧洲的绵羊是黑的”和 “苏格兰的动物是黑的”与不雅察的逻辑关系是一样的,都是在“对象a是范围A的一个实例”的前提下将 “a是B” 推广到“A是B”。当一个对象同时属于多个群体时,选择哪个做归纳综合就是个问题了。这个选择显然不是肆意的,但又没有一个尺度谜底。好比说在描写或人做了某事(可能是功德也可能是坏事)时,把这小我称号当作某省人、某校结业生、某公司雇员、某行业从业者都是可以的,但在读者心目中造当作的结果会几多有所分歧,恰是因为这个标签会指导标的目的特定偏向的归纳。

上面两个例子已经不仅仅是抽象的哲学问题了。若是我们设计了一小我工智能系统,那它在见到上述黑乌鸦、黑绵羊,以至于红苹果时,应该发生什么样的结论?当然一个保险的方案是不进行任何归纳或归纳综合,但这种系统的“智能” 就半斤八两有限了。我们都知道以偏概满是不合错误的,但又都感觉能见微知著的才是伶俐人。

统计进修也躲不开这些麻烦

一旦归纳结论的真假被看作水平问题,一个显然的选择就是将其暗示当作概率,而统计推理的根基功能恰是经由过程对现有样本的阐发来展望将来事务的发生可能性,是以也是归纳的一种形式。

这样说来,休谟的问题在这里也存在:怎么包管已知样本和将来事例顺从同样的统计纪律呢?从底子上来说这是没法子包管的。但在概率统计的理论模子中,这个问题可以操纵根基假设往返避失落。好比说一个常见的假设就是所有样本,包罗已经收集到的和将来会碰到的,都是从统一个样本空间中按照某种确定的概率分布获得的。常见的实例是掷骰子。尽管频频掷一个骰子时获得各个数字的机遇可能是分歧的,但只如果骰子和抛掷情况不变,这些机遇就不变。尽管我们起头时不知道这些机遇的巨细,用曩昔的呈现频率来展望将来的数字仍是合理的。这里能包管的不是每次都猜对,而是对各个数字呈现的统计纪律的描述可以越来越精确。

但这不申明概率统计解决了休谟问题,而是相反:只有在有来由认为休谟问题不呈现或不严重的情境下,才能利用概率统计。并不是所有应用情境都知足这个前提的。好比说把某只股票的股价看作一个随机变量就纷歧定是合理的,因为其取值未必遵循一个不变的概率分布。这应该算是常识,但往往被有意无意地忽略,其成果就是即使所有计较都合适概率统计的要求,结论也不具有规范性,因为在这个问题上用这个模子的正当性自己就有问题。

迩来引起越来越多存眷的“机械进修发生成见”的现象就直接源于练习数据的代表性,这其实也是休谟问题的表示形式之一。所谓“成见”往往相对练习数据集而言是“正见”,只是把它用于一个新的数据集时才看出“偏”来。在新的数据达到之前,一个统计结论是否属于成见其实是无从判定的。这就是严酷按照概率统计模子作出的展望仍可能掉败的本家儿要原因之一。这种问题和由小概率事务、数据不足、数据中的噪声等等所造当作的问题分歧,是不克不及用概率统计所供给的手段来解决的,因为这些手段的有用性自己就是成立在休谟问题不会呈现的前提之下的。

面临一个具体应用问题,概率统计到底能不克不及用不是很轻易就能断定的。常见的对策是先用用尝尝,好就接着用,但以前的当作功其实不克不及包管今后的当作功,即使是那些号称“已被大量事实充实证实”的结论也是如斯。在情况不竭转变的环境下,无论是如何的大数据,也只申明曩昔,而无法精确展望将来,即使在概率意义下(如“包管95%的准确率”)也做不到。前一段时候,八百多科学家联名要求遏制利用“统计显著性”,也和这个问题有关。所谓统计显著性就是成立一个尺度以确定在什么环境下可以把一个统计假说算作是“真的”。这些科学家认为不确定身分老是存在的,所以没有一个同一的尺度可以把统计结论转换当作非真即假的二值结论。

除了休谟问题之外,前面提到的其它和归纳有关的问题也有其在概率统计中的响应形式。好比说对于归纳结论不惟一的问题,在机械进修中的一般处置体例是预先设定某种“归纳偏好”,以达到限制和选择结论的目标。若是太切近具体数据,即归纳综合水平太低,会造当作 “过拟合”,不大可能有用地推广到尚未不雅察到的对象。当一个待判定对象同时属于多个参照集(别离遵照春秋、性别、籍贯、职业等等划分)时,按照哪一个数据集之上的统计来得出判定(好比这小我有多大可能患某种病)也不是个简单的问题。

纳思怎么办

我设计的通用人工智能系统 “纳思” 在前面几篇里面介绍过了,这里只会商和归纳直接相关的部门。从一起头,我就把智能看作某种一般理性原则,而非解决某些具体问题的方式。这样一来就直接撞上了休谟问题:若是认可将来经验和曩昔经验可能是纷歧样的,那么从曩昔经验中总结出的纪律(非论是用归纳仍是此外法子)在将来就没法包管必然准确。在这种环境下,怎么做才算“理性“?举例说来,即使已知的乌鸦都是黑的,那也不克不及包管未来碰不上白的。这是否申明展望下一次碰着的乌鸦是黑的或是白的同样 “合理”,因为二者都有可能对?当然,任何正常人都认为在这时猜“黑“ 是显然准确的,但这是为什么?只是因为“从来如斯”?

传统的理性模子都是基于经典逻辑或者概率论的,其结论的 “真” 是以其正义的(成立在商定根本上的)真和推理法则的 “保真性” 为前提的。天不变,道亦不变,而一旦 “得道”,其逻辑结论天然也就不成能错。照此行事,天然就是合乎理性的了。这简直很圆满,但一旦天道有变,亦或无法鉴定所得的是否真的是“道”(按休谟的论证,这种鉴定不成能获得),那就无计可施了。

当然还有另一种显然的选择,就是接管休谟的结论:归纳就是一种心理习惯,没事理可讲。人工智能当然也可以这么做,就是用“人脑就是这么干的” 作为所有本家儿要设计的依据。这种做法天然有其价值,但不是我想做的。我们简直应该领会人脑在心理和心理层面的工作道理,并在人工智能设计中加以借鉴,但我总想多问一句:我们在计较机里面也非得这么干才“对”吗?

我的选择是接管休谟的论证,但不止步于他的结论。在实际情况中,按照曩昔的经验是不成能严酷、切确地展望将来,并包管所有结论的准确性的。人脑简直是在进行这种展望(以归纳为本家儿要形式之一),但这不仅仅是一种习惯,更是一种理性。和传统的理解分歧的是,在这种环境下理性不包管展望当作功,而是一种顺应性行为。简单说来,“顺应性行为”就是按照曩昔的经验展望将来,尽管这些展望经常会错。“尽力顺应情况”和“包管顺应当作功”不是一回事,前者是可以做到的,尔后者纷歧定。

我们可以把一个系统的外部情况粗略分当作三种:若是情况绝对不变且遵循系统可熟悉的纪律,传统的理性模子和依此设计的“正义化系统”会是最当作功的,因为只要正义和法则搞对了,系统就毫不会犯错。若是情况可变但相对不变,那么顺应性系统及响应的“非正义化系统” 会是最有但愿的,因为这时正义化系统就太僵化了,完全无法应对料想之外的环境,而非正义化系统尽管不克不及包管不犯错,但起码有展望准确的可能。若是情况的转变极其敏捷或无迹可寻,那任谁也是力所不及了。所以,照我看来,智能也好,科学也好,都不是以 “包管当作功” 为其理性尺度的,而是表现了一种“尽人事,听天命”的立场,是不以当作败论英雄的。

我上面的结论不仅仅是一个哲学立场,而是有直接的具体后果的。如《证实、证伪、证实、证据:何故为“证”?》中介绍的,纳思和其它推理系统的一个底子分歧点,就是此中一个陈述(如 “乌鸦是黑的“)的真值不是描绘其与客不雅事实的合适水平,而是和系统相关经验的合适水平,是以会跟着经验而转变。系统中的推理法则(包罗演绎、归纳等等)也都是在这个意义下 “保真”,就是包管不无中生有,但不包管百步穿杨。若是让纳思见到那只绵羊,它的表示会是那个天文学家和物理学家的综合:它的结论可能是 “苏格兰的绵羊是黑的”, 而其真值对应于现有证据的量(所以见过一只、两只或一千只时成果是分歧的)。

对于归纳结论不惟一的环境,纳思是由当前的注重力规模决议哪个结论会被生当作的,而不是靠一个固定的归纳偏好。具体说来,统一个不雅察成果也可能被归纳综合为“欧洲的绵羊是黑的” 和 “苏格兰的动物是黑的”,取决于当前系统中响应概念的活跃水平。当然,这些结论看起来很荒谬,但那是因为我们心中大量其它信念(尤其是已知反例)的影响。小孩子完全可能那么想,并且不克不及算是想错了,这和结论的对错是两码事。

至于乌鸦悖论,在纳思中是不会呈现的,因为在那边“乌鸦是黑的”和“不是黑的就不是乌鸦”有分歧的真值和语义。这两个陈述有不异的反例(“不黑的乌鸦”),但有分歧的正例(别离是“黑乌鸦”和“不黑的非乌鸦”,尔后者包罗红苹果)。是以,纳思在看到已知红苹果时不会影响它对 “乌鸦是黑的” 的相信水平。这两个陈述在经典逻辑中等价,因为在那边“真”就是“没有反例”的意思,而与正例无关,但这个等价原则不克不及推广到正反例都影响真值的逻辑系统(如纳思)之中。

我相信纳思对归纳的处置比其他理论更天然、合理,尽管这个方案和今朝本家儿流的基于经典逻辑和概率统计的方案有底子不同。我不期望靠这篇短文说服良多人,有乐趣的读者可以去读我的学术文章。我只是想提醒大师注重某些经常被习惯性忽略的问题。

本文的另一个目标就是以归纳为例申明我的一个根基信念:人工智能中的良多焦点问题起首需要一个得当的哲学解,然后是把这个哲学不雅点切确化的数学解,最后是把这个数学模子操作化的程序解。这三者缺一不成。


参考文献

1. Pei Wang, Formalization of evidence: a comparative study, Journal of Artificial General Intelligence, Vol. 1, Pages 25-53, 2009

2. Brian Skyrms, Choice and Chance: An Introduction to Inductive Logic, 4th edition, Belmont, CA: Wadsworth, Inc. 2000

特 别 提 示

版权声明:本文由《返朴》原创,接待小我转发,严禁任何形式的媒体未经授权转载和摘编。

《返朴》,致力好科普。国际闻名物理学家文小刚与生物学家颜宁联袂担任总编,与几十位学者构成的编委会一路,与您配合求索。二次转载或合作请联系fanpu2019@outlook.com。

  • 发表于 2019-12-16 02:00
  • 阅读 ( 906 )
  • 分类:其他类型

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
联系我们:uytrv@hotmail.com 问答工具