琴鸟(lyrebird)生性胆小,但卡尔·伯格斯特龙(Carl Bergstrom)不是。只可惜,这位华盛顿大学的理论与演化生物学教授输给了琴鸟的胆怯。他是一位有着数十年经验的观鸟发烧友,但他从未在野外看到过琴鸟。今年早些时候,我在澳大利亚卡通巴镇外的蓝山山脉国家公园看到了一只琴鸟。当时,伯格斯特龙正和我一起徒步,就在我身后不远的转弯处,我几乎能听到他的声音。我们一行人都是动物认知和多元智能的研究者,在一次会议期间组织了写作静修的短途旅行。大家一起到蓝山国家公园里的贾米森谷(Jamison Valley)散步。琴鸟是那里的特有物种。
我心想,也许可以冲着桉树的树冠大吼一声“卡尔!”——我们从没商量过把大喊“卡尔!”当作观鸟的信号,但我知道(他也知道我知道)他从来没有见过琴鸟。他一定能理解我这么做的原因吧。毕竟,我整个下午都在和他开玩笑,问他:“你见过琴鸟吗?”这是在模仿物理学家恩斯特·马赫(Ernst Mach)有名的口头禅。他总会这样问那些相信原子存在却从未见过原子的人。
然后,我转念一想,曾经有一位攀岩家和自然写作者告诉我,英国博物学家J. A. 贝克(J. A. Baker)的名作《游隼》(The Peregrine, 1967)绝对不能当有声书听。追踪鸟类时需要保持安静,而朗读的声音会破坏这种静默感。他说,人发出的声音绝不能比一支羽毛笔在纸上沙沙摩擦的声音更响。只有这样,鸟类才不会把你当成异类:你的动作也会产生摩擦感,你也在觅食。那只行踪诡秘的琴鸟向蕨类植物的更深处不断穿行,一边在地上划动,寻找昆虫;一边朝着砂岩和页岩峡谷的方向挪动。我看到这些,默不作声地指了指。
这个动作也是人类独有的能力之一,其他动物没法理解(狗当然可以,那是因为我们选择性地驯化了它们)。狼就不能理解默默用手指的动作。大猩猩也不能。但毫无疑问,伯格斯特龙可以。他研究的是交流的演变和自然界储存讯息的物理学原理。回到那一刻,我的沉默也是在传递一种讯息:我不想吓跑那个东西,尤其那个东西可能是一只琴鸟。
琴鸟的名称是个错误。19世纪,大英博物馆的一位标本师给琴鸟取了这个名字。他从没见过野生的琴鸟,却想当然地以为,这种鸟类的尾羽会像孔雀那样展开,形状像七弦竖琴的弧形琴木。实际上,这类鸟的羽毛并不像他想象的那样。雄鸟的尾羽展开时,看起来就像日本扇子一样。相似性会迷惑人类的眼睛。今年早些时候,《科学》(Science)期刊上发表了一系列论文,解答了另一个与鸟类大脑相关的谜题。这项研究涉及一个名为皮层(Pallium,拉丁语意为“披风”)的大脑区域。几十年来,演化生物学界一直争论不休:应该将哺乳动物和鸟类的皮层视作同一脑区,还是功能相似的区域。这两个脑区具有一些相似性,包括所在位置(大脑前部与顶端,类似覆盖物,就像“披风”一样)、认知功能(使用工具、解决问题的能力和复杂的社会行为,比如心智理论)和结构(呈柱状,就像一座摩天大楼,每层有不同的分工,层层相互关联)。自然偶尔会在不同物种中重新演化出同一种有益的特征。皮层似乎正是趋同演化(convergent evolution)的一个例证:两个脑区分别独立演化,却承担了相似的功能。
最终,伯格斯特龙在小路转弯处现身,手里举着相机,那相机看上去活像奥运短跑健将的一条腿。他调动前脑所有的思考能力,用一种优雅而安静的姿势,踮着脚走向琴鸟最后出现的位置。只可惜,那只琴鸟也动用了前脑全部的思考能力:它躲起来了。胆怯再次取胜。琴鸟消失不见了。
蓝山其实不是山。乍看山峦绵延的景象,其实是高原抬升和崩裂形成的地貌。这片高原在过去一亿七千万年间,经过侵蚀与挤压,断裂成了峡谷与峭壁。
高原上最著名的地标是“三姐妹峰”(the Three Sisters)——三座岩壁侵蚀后留下的砂岩尖峰。当地传说是这样描述的,三名原住民少女得罪了沼泽怪兽“本耶普”(bunyip)。她们的父亲为了拯救女儿,用一根魔法骨头把她们变成了石像,自己则化身一只琴鸟。但他弄丢了那根魔法骨头。这就是为什么今天人们还能看到琴鸟在地面上和灌木丛中四处搜寻:啄食、刨抓,寻觅着,也期盼着。这些鸟儿不只在觅食,也在寻找那根神奇的骨头。
其实这个故事也不是真事。它甚至可能不属于澳大利亚原住民的“梦创时代”(Dreamtime)神话体系。有人说,这是一个澳大利亚少年为了完成课程作业编的故事,意外地留传了下来。不过有一点确定是真的:三姐妹峰的故事不是第一个也不是最后一个将生命与灵魂注入坚硬岩石的万物有灵传说。三姐妹峰的构成物质是悉尼砂岩,也叫“黄金砂岩”,其中含有硅氧结合而成的石英晶体。石英可以提纯为芯片级硅材,用来制造制造晶体管。将足够多的晶体管组合起来,接通电流,加载正确的计算机代码,然后启动,就可以得到人工智能。
地球上智能生命的演化轨迹,可用动词的演进加以刻画:移动、繁衍、捕猎、隐藏、感觉、创造、使用、思考。伴随人工智能与高能聊天机的出现,专家们开始争论,哪些动词事关“智能”与否。然而,就像人工授精、人工心脏与人造礁一样,人工智能最开始就是为适配生物系统设计的。其能力与目的,都只能从这种互动中推衍而来。
尽管如此,也存在一种说法,人类已经借助大语言模型在全球数据中心构建了一套计算体系,跳过移动、繁衍、捕猎、隐匿、感觉等,直达智能。这是真的吗?
计算机工程师布莱斯·阿格拉-阿卡斯(Blaise Agüeray Arcas)就是这么认为的。事情某种程度上就是如此——答案取决于我们如何定义“智能”。在他的新书《何为智能?来自人工智能的演化、计算与心智启示》(What Is Intelligence? Lessons from AI About Evolution, Computing, and Minds)中,阿卡斯从博物学和计算机科学出发,以广博的学识和难得的谦逊给出了肯定的回应:计算机确实拥有智能。问题不在于它是什么,而在于它做什么。
作为一名严谨的科学家,阿卡斯将核心问题拆解成了数个更易处理的小问题:生命如何演化?智能是否是一个必要的前提?所有能够计算的存在都具有智能吗?假设智能的不同特征可以在自然界独立演化形成(比如,琴鸟的大脑皮层与伯格斯特龙大脑皮层的分化),这是否意味着,只要结构合理,智能就可以出现在任何物质、任何地方?
作为谷歌的计算机工程师,阿卡斯信奉数学、计算与功能的第一性。他写道:“生命体是各类功能的组合,也就是说,生命体本身就是一种功能。”人类在悉尼砂岩中看到智能的存在,并不是一件难以理解的事。人类大脑同样由钙、碳等无生命的基础元素构成:“地球上的金属与砂石可以被锻造成蒸汽机与芯片,正如我们摄入体内的钙会成为骨骼,形成离子电流。”所以区别到底是什么?
人类无法制造的事物远多于能够制造的事物。我们无法从零开始合成眼泪、羽毛、天然橡胶、原油、咖啡、恒星、生命体、琥珀、锂。(天文学家卡尔·萨根〔Carl Sagan〕曾经说过,我们甚至没法做苹果派:“要从零开始做一个苹果派,你必须先创造出宇宙。”)有些事物的诞生,需要地质年代亿万年的积累,加上足以摧毁宇宙的能量,或是人类暂且无法理解的化学反应。当然,人造钻石、合成橡胶、人造石油已经存在,但它们的物理性质在细微处依旧与天然材料有所不同。例如,我们可以用塑料树脂裹住一只蚊子,但得到的样本却无法像天然琥珀那样,完好地保存生物的微观结构形态和有机质残骸。有时,天然物质无可替代。
假设一切就如阿格拉-阿卡斯所想的那样,我们从零开始,用硅基制造了智能。那么和天然智能相比,这种合成智能是否存在缺陷?人工智能可以生成近似于人类的语言、推理和思维,这就足够了吗?在那些精妙的细微处,是否有些东西遗漏了?所谓天然智能,究竟又是什么?
多年前,我造访了海德尔霍夫研究站(Haidlhof Research Stantion),从维也纳坐火车大概一小时的车程。研究站位于奥地利阿尔卑斯山脉深处,那里饲养着全球规模最大的啄羊鹦鹉(Kea)圈养种群。啄羊鹦鹉是世界上唯一一种高山鹦鹉,以无拘无束的、坦率的好奇心著称。它还有个别名叫“阿尔卑斯山开心果”。许多动物认知学研究者认为,啄羊鹦鹉或许是地球上智商最高的鸟类。
啄羊鹦鹉的好奇和琴鸟的羞怯截然相反。它们巴不得被人发现,仿佛觉得这样很好玩。我到访时,鸟舍里养着23只成年啄羊鹦鹉和3只滑雪靴大小的幼鸟。工作人员提醒我,新来的陌生人大概率会成为各种刻画其行为的动词的宾语:玩弄、攀爬、凝视、飞扑、鸣叫、啄咬。这则警告语气严肃,让我想起了核磁共振机房里的金属物品禁令,仿佛啄羊鹦鹉的好奇心和磁场线一样,是宇宙中某种本源性的力量。
预言果然应验了。几只鹦鹉围在我脚边,啄着我靴子上的黄色缝线。还有几只跳到我的肩膀和手臂上,挨个啃咬我的衣服纽扣。一只鹦鹉把喙探进我的腋下,沾上我的气味,再蹭到自己的羽毛上。另外有两只停在我头顶的树枝上,保持着一段警惕的距离。我看得出来,它们正在制定战略,想从两侧包围我。半小时过去,我依旧是它们永不停歇的好奇心所追逐的焦点。
研究员梅根·兰伯特(Megan Lambert)给我介绍了研究站的鹦鹉:阿努(“怪脾气”,总是趴着,不理人)、科米特(爱啄人)、皮克(温顺,“痴迷于嗅觉”,擅长解谜)、让-吕克(“恨死我了”),还有桑妮(郁郁寡欢,喜欢拔毛)。兰伯特曾经研究过乌鸦、渡鸦、黑猩猩、狐猴、长臂猿和鳄鱼的情绪和认知。我问,她眼中的啄羊鹦鹉是什么样的。她回答:“一团软乎乎、毛茸茸的小可爱。”
兰伯特告诉我,关于动物好奇心的理论源于这样一个观点:由于外部世界没有明显的总分或分数可以追踪和优化,生命不得不进化出一种内在的奖励机制和动机。这样说来,新的信息可以被看作类似游戏积分一样的事物。“每时每刻,源源不断的信息洪流都在涌向我们。我们应该如何决定关注哪些信息?这才是问题的关键。”兰伯特说道。
广义上讲,好奇心是生物主动搜集外界信息的本能表现。苏黎世大学生物学家索菲亚·福斯(Sofia Forss)研究黑长尾猴与狐獴的猎奇行为。她将好奇心定义为“出于内在动机主动获取新信息的行为”。啄羊鹦鹉的好奇心驱使它探索新奇的事物,收集感官信息,将这些信息载入自己世界的心智模型,从而更好地预测后续的变化。“你可以这样想,大脑本质上是一台用来做出预测的机器,它的终极‘目标’,是缩小内心世界模型与外界感官输入的偏差。”兰伯特说道。
在阿尔卑斯山深处,我同时成为了啄羊鹦鹉本能的关注目标、行为的奖赏和信息搜集练习的对象。久而久之,啄羊鹦鹉对我,乃至所有外来者的预测和判断会越来越精准。阿格拉-阿卡斯的观点更为激进。他认为预测能力就是智能。“难道智能只是‘解决’预测问题后的副产品?还是说,预测能力等同于智能?”他倾向于后者。阿卡斯提出,建立一个关于世界整体或其他事物的内在模型,不仅在有效预测未来时才具有价值,预测能力本身就具有价值。“事实上,从生物演化的角度看,只有那些通过自身模型成功预测未来的生物,才有未来可言!”
这句话并非无心之谈。加以推导,这一观点可以触及心智的本质:“当通过构建认知模型来理解他者的心智变得至关重要时,心智就诞生了”,他这样写道。阿卡斯不仅阐释了心智的演化如何进阶,发展出一种“有效预判其他具备预测能力的个体”的能力,还在写作中预估了读者的认知模型。他知道我们不熟悉这一领域,所以他把复杂的论证穿插在计算、生物与脑科学入门知识的介绍里,便于读者理解。
人工智能之所以能预测它所属的世界,一大原因在于程序中编入了一种“好奇心”。像啄羊鹦鹉一样,有些AI会探索虚拟或现实世界来获取信息。总的来看,在奖励稀缺或不明的虚拟场景中,由好奇心和内在奖励机制驱动的智能体,表现往往优于不具备这类特征的智能体。
另外,不同的AI也有自己的怪癖:一个设定为追求新奇体验的AI会自杀,只是为了体验游戏结束的界面;一个设定为规避死亡的AI在玩俄罗斯方块时,无限期地暂停了游戏;还有一个设定为增强惊喜感的AI,开始病态地沉迷看电视。(作家大卫·福斯特·华莱士〔David Foster Wallace〕也沉迷看电视,他说过:“娱乐产业的目的,就是攫取注意力,让你无法看向别处。”)
没有两个完全相同的个体,即使二者属于同一物种,这是达尔文的思想中最具变革性的观察之一。每个生命都是由一些复杂的生物结构演化而来,在与特定环境的互动中生长,因此也永远无法保持一成不变的形态。严格来说,即使是所谓的“克隆体”,也不可能完全相同。亚马逊莫莉鱼(Amazon Molly)是一种手指大的小鱼。它是人类首先发现的可以通过无性克隆繁殖的脊椎动物。所有个体都是母体的克隆体,依靠雌核发育繁衍。精子仅起到激活鱼卵的作用,过程结束就会被舍弃。加州大学戴维斯分校演化与生态学教授凯特·拉斯科夫斯基(Kate Laskowski)专门研究自然界中这类特殊物种的个体差异。她告诉我:“从来到这个世界的第一天起,亚马逊莫莉鱼就存在个体差别。”出生数小时后,小鱼就会表现出自己的不同之处,而这些特征会伴随它们终生。
在阿卡斯看来,生命偶尔不完美的繁衍能力是迈向思维与意识的关键。他发现计算机也具有相似的特征。在书中,他描述了硅基环境中构建的“不完美的复制机”:“极短的代码片段,存在一定可能性,能够生成新的代码”。阿卡斯认为,在任何系统中构筑智能,都需要一些最基本的元素:代码、编译器、代码的自我复制能力、随机变异的可能性。人类生命恰好具有以上所有特征:DNA(代码)、核糖体(编译器)、两性繁衍(复制能力)、个体差异(随机变异的可能性)。
看着一段代码从简单的规则发展成复杂的模式,阿卡斯仿佛窥见了生命的起源。海底岩缝中迸发出热液,在原始的热浪附近,单细胞诞生了。而那段代码“或许就与地球生命诞生之初的物质极为相似”。
离开啄羊鹦鹉研究站几天后,我和实验室的几位成员去了维也纳一家名为“鸟舍”(BirdYard)的鸟类主题地下小酒馆。席间,我问大家:动物认知学者以后会不会研究大型可移动机器人的好奇心,就像研究海德尔霍夫的鹦鹉那样?如果我们将人工智能投放到云端和现实世界,又该由谁来研究它的认知能力(如果存在的话)?是工程师,还是博物学家?什么学科的方法论最适合研究聊天机器人的智能水平?(一位研究员不假思索地回答:“或者更有可能的是,它们会来研究我们。”)
研究鹦鹉好奇心的鸟类学者,是否应该去研究虚拟的好奇心?研究心智理论的黑猩猩专家,是否该把自己的研究工具用来解读聊天机器人的推理能力?研究亚马逊莫莉鱼的学者,是否该去分析那些复制粘贴一般近似于克隆的云端程序演化谱系?站在百年来博物学巨人的肩膀上,投入数十年精力探讨这些话题的研究者们,又该如何看待“智能”“好奇心”“个体差异”这些概念在自然界中的含义?
人工智能企业热衷于为“智能”寻找一套清晰、可测量的定义,这一部分是法务压力造成的。ChatGPT的开发方OpenAI在合约中承诺,在研发出“合格的通用人工智能(AGI)”前,自己的模型必须和微软公司共享。这项条款就暗藏在巨额的投资协议中。在法律层面,每个词语都必须有明确的定义。
然而在科学研究中,绝对不能先下定义,再反向推导。原因很明确,这种做法会造成偏见:从定义出发反推,得到的只能是一种人造物,而非客观事实。在科学研究中,一起始于问题,研究者通过不断打磨,最终得到一组更好的问题。科学探索不是追逐一个现成的定义,仿佛冲过那条终点线一切就结束了。科学是一项艰辛的劳动,是在未知的情况下,逐步解决难题,过程中不做预设,也不追求抵达一个终极的目标。
我们至今没有对感觉、智能、生命、意识等概念的定义达成共识,因而也无法确凿地判断,合成智能和人工智能距离成为真实的生命究竟还有多远。或许,就像运动、热量、自然选择这些概念一样,最终的定义会和对它们的解释是一回事。长期研究这类问题的动物行为学和神经科学领域至今没有给出一致的回答。这并不是一种缺憾,而是一种从容不迫的审慎。
布莱斯·阿格拉-阿卡斯拥抱了这份审慎,却又忍不住赞叹现代计算能力底层逻辑的精妙之处。在一段关于机器学习的专业论述里,他不经意地写下了这样一句话:支撑聊天机器人的核心算法“更像是一种发现,而不是发明”。如果这个判断是准确的,最接近阿卡斯观点的或许就是19世纪的英国物理学家詹姆斯·普雷斯科特·焦耳(James Prescott Joule)。焦耳对热量与能量的研究证明,自然做功与机械做功可以相互转化。卡路里既能描述大脑的能量输入,也能描述蒸汽机的能量输入,二者可以用同一个方程式计算。有朝一日,人类发现人工智能与生物大脑共享同一套学习和思考的普适性法则,我们应该归“功”于《何为智能?》这本书。
原文发布于Los Angeles Review of Books,乌兰托雅译。