凡妮莎·张
Vanessa Chang

独立策展人,列奥纳多/国际艺术、科学与技术协会计划负责人,加州艺术学院视觉与批判研究讲师。

2021-04-12

阅读时长11分钟

#艺术·科技

译文 首发

2020年7月,人工智能研究公司OpenAI高调发布了其最新的语言生成器GPT—3。GPT—3的全称是“第三代生成型预训练变换器”(Generative Pre-trained Transformer 3),运用深度学习软件及神经网络来生成人类能够理解的文本。网民们纷纷用它来创作诗歌、戏剧和其他形式的文学,向它“投喂”从莎士比亚到苏斯博士(Dr. Seuss)的各种内容,让GPT—3获得了大量文字数据。

与人工智能取得新进展时的通常情况一样,专家和公众纷纷涌来评估这一语言模型的创造力。尽管GPT—3在语言流畅性方面令人惊艳,但根本上仍存在不足:它无法真正理解自己生成的词句,写得越长语意越不连贯。

人工智能距离对创作型写手造成实质性威胁还有很长一段路要走,但它已经开始成为一种创意写作的工具了。而且与所有写作工具一样,人工智能对“颅骨是人类心智的边界”的观念提出了挑战。

种种书写系统都是化虚为实。通过将想法整理成文档,书写系统成为了外部记忆的构成组件,能够将思维过程转化为一种心智与数据库之间的交互过程。作为假性记忆(prosthetic memories),最早的文字形式可以被视为当代机器学习特有的信息提取分析过程的先驱。人工智能为我们提供了运用数据库的新方式——新的思考与创作方式。

通过拓展人的认知能力,文字有助于维持影响深远的文化变迁。人工智能可能也会起到同样的作用。但读写能力留下的影响并非处处一致,同理,就文化变迁而言,书写工具本身与我们用这些工具讲述的故事同样重要。

插图.jpg

拉斐尔·阿拉尔(Raphael Arar)为《Noema》杂志开发的AI诗人程序(示意图)


数据库与外延心智

2017年,自称“刚左数据科学家”(注:引申自“刚左新闻”,与传统新闻背道而驰,突出夸张大胆、主观嘲讽的写作风格)的艺术家罗斯·古德温(Ross Goodwin)开着一辆凯迪拉克从纽约去了新奥尔良,车载电脑中安装了经过三个语料库训练的人工智能软件,分别是科幻小说、诗歌和“荒凉”文学,当然还有Foursquare定位数据。他提前编好了算法,用上百本书来塑造人工智能程序的语言矩阵和审美感性。另外,他还在谷歌的支持下为轿车配备了麦克风、时钟、GPS单元和车顶摄像头。

在古德温的南行途中,神经网络系统综合运用了传感器的输入信息,然后写出一种富有诗意的文字,令人不禁想到杰克·凯鲁亚克(Jack Kerouac)那种简练的意识流文风。一路上,传感器数据激发出了对南下见闻的描绘,时而抒情,时而又是超现实风格。

一个Foursquare算法识别出来的位置催生了这样一段话:“鹰巢餐厅:一家位于戈尔兹伯勒或海洋站的美式餐厅,一处鱼乡,仿佛是一个已经集结了三天的男人。”人工智能生成的词句被打印在长长的收据纸卷上,还附有时间戳来标明生成的时间。最终成果名为“一路”(1 the Road),古德温宣称它是“最长的英语小说”。


“认知源于一个由大脑、身体和世界组成的生态系统。”


《一路》既是一篇文本,又是一次表演,它突出体现了在人工智能参与创作过程的情况下,围绕作者身份认定所产生的诸般繁难。最终成果是由算法写出来的,算法又是古德温编出来的。人工智能的文风——从选词到句法——来自人工智能与数据集的动态交互,而这些交互过程又经过了古德温的代码编写、硬件选择和驾驶活动的调谐。古德温与人工智能程序上演了一出21世纪版的结伴公路旅行,引发了一幅兼具合作性与分散性的创意写作图景。这种作者、算法、环境与数据库之间的持续互动过程——这是一种体量极大的记忆,远非人类心智所能轻易提取——掩盖了赋予它活力的复杂系统。

心智哲学家安迪·克拉克(Andy Clark)和戴维·查默斯(David Chalmers)发表于1998年的论文《外延心智》(The Extended Mind)开篇就提出了一个问题:“心智止于何处,心智以外的世界又始于何处?”这篇文章或许是对外延心智论的知名度最高、影响力最大的阐述。两人的观点自新千年以来愈发流行。他们反对传统心智观,即心智仅源于大脑的物理过程,止于颅骨和头皮。外延心智论的主张是,认知是大脑物理过程与我们用以完成认知任务的工具之间的互动过程。

这些工具——比如数学家用来解算公式的铅笔和草纸——与我们的思维过程无缝融合,对认知能力的功能意义不亚于大脑。通过这些工具,我们的心智延伸到了世界中——反过来世界也延伸到了心智中。因此,认知源于一个由大脑、身体和世界组成的生态系统。

通过将外在于人类心智的信息具象化,书写系统——从手写文字到当今的人工智能——为这个动态的生态系统注入了新的元素。一家由小说家维克拉姆·钱德拉(Vikram Chandra)牵头的写作软件初创企业Granthika(注:梵语词,意为“吟诵者”)将外延认知观运用到了现实中。Granthika是一个智能综合写作环境,预想定位是作者的助手和资料保管员——也就是体外的大脑。这款软件能帮助小说作家搭建和追踪复杂的世界观和时间线;此外还有其他类似工具正在开发中。作家可以把杂活交给它打理,以便专注于主题、情节、人物等叙事要素。


“与所有写作工具一样,人工智能对‘颅骨是人类心智的边界’的观念提出了挑战。”


按照钱德拉的看法,Granthika将文本与语义融为一体;在程序中的写作过程产生了知识,知识反过来又融入了文本。通过为知识库持续添砖加瓦,Granthika便为故事世界建立起了一套本体论。它可以运用经典的一阶逻辑来构建幕后的时间线;另外,与其他数据库不同,它可以在人物、地点、物件和事件之间形成有意义的关联。这款软件是维持想象世界连贯性的好帮手,目的是解放作者,免得写了后面忘了前面。

通过将搭建世界观的工作交给计算智能,Granthika延伸了创意写作者的认知能力。它是创意写作者与智能数据库之间的共生关系的化身。类似地,“一路”也将写作的工作量分给了人类和机器主体,尽管古德温来了一个反转,将人工智能定位成了写作活动的思维与感知中心。

与作者独自创作的传统观念不同,上述活动将创意写作理解为人类与科技携手造就的产物。但这些智能机器工具并没有从根本上颠覆文字的历史,而是文字作为一种辅助记忆技术的下一个符合逻辑的演化阶段。


记忆与读写能力

在键盘和触摸屏成为重要通讯媒介的当今时代,手写等传统交流形式几乎带着自然气息。尽管手写看似天然,但它其实也是一种技术,引发过交流、认知和文化层面的深刻变革。

文字发明之前,口语存在于人际交往之间,刚说出来便消散了。文字抓住了匆匆溜走的话语,并用一种可见而持久的形式将话语具象化。对话必须发生在两个活着的说话者之间,文字却能在书写者不在场或去世后继续存在。出于上述原因,柏拉图在《斐德若》中对文字有一段著名的批判,说它会侵蚀人类的记忆力。

从购物清单到百科全书,文字为人们卸下了存储和提取信息的认知负担,从而延伸了人类的心智。文字是一种让我们能够将个体和集体记忆外包出去的技术。通过持续创造可查阅的信息库,读写能力让人与语言之间的互动形式有了新的可能——新的信息存储技术提供了知识的系统化积累。因此,读写能力是成体系的逻辑学、哲学和诸门学问的一根核心支柱——是最终产生了人工智能的知识基础。


“柏拉图在《斐德若》中对文字有一段著名的批判,说它会侵蚀人类的记忆力。”


除了上述一般方面的因素以外,研究书面文化与口语文化——口语文化就是完全不知文字为何物的文化——的学者们对文字如何改变思维模式和交流模式有不同的看法。以沃尔特·翁(Walter Ong)等六、七十年代学者为代表的一些人提出了一些普遍化的主张,阐述口语文化如何运用特殊的语言和辅助记忆策略来传承文化。在影响力巨大的《口语文化与书面文化》(Orality and Literacy)一书中,翁引述了《圣经》和《奥德赛》等本为口头流传的著名文篇,从而将语形句法与思维结构联系了起来。这样一来,他就发现语言原来是辅助记忆的一环。

这种观点在之后几十年里受到了挑战,有人认为它把“原始”口语文化和读写能力的总体化影响看得太简单了。批评者尽管肯定了读写对思维的影响,但也指出这种影响极其复杂,因具体情况而异,实在算不上是确切的文化特质。由于书写系统在性质和用法上存在巨大差异,学者们描绘的书面文化是一个多元宇宙,以便贴合文字具体产生的特定文化。


讲故事的技术

作家特德·姜(Ted Chiang)在短篇思辨小说《双面真相:事实与情感》(The Truth of Fact, the Truth of Feeling)中探讨了多重读写能力、记忆与主观性之间的关系。小说有两段彼此平行的情节——一段在不久的过去,一段在不远的将来。两段情节的主题都是文字与回溯技术,以及这些技术与知识和情感之间的勾连。

在前一段中,一位老记者讲述了自己研究和使用一种名为Remem的新技术的经历。Remem是一种人工记忆技术,用户可以通过它为自己的生活日志——也就是日常生活的影像记录——建立索引和进行搜索。后一段的主角是来自尼日利亚口语文化蒂夫族的小伙子吉金基。在一位传教士的教导下,他学会了读写。吉金基的读写水平通过学习吸收殖民和宗教文本得以提高,而在这个过程中,他发现自己很难调和自身口语文化与书面文本的关系。

读者们通篇都能窥视到记者和吉金基的内心世界,看到两人的信念因新的读写能力而不再稳固时所感受到的日益增长的好奇、困惑与痛苦。两段情节都是围绕真相的概念展开;正如标题所示,真相有事实与情感两面。记忆从来不是简单的回溯,记忆的价值也不能用准确与否来衡量。

特德·姜从一开始就在两种截然不同的读写能力之间建立了清晰的类比关系,一种是通过文字,一种是通过新媒介。小说开篇就是记者在反思女儿的数字读写能力的本质。妮可不用钢笔,也不用键盘,“而是在心中默读,视网膜投影装置将文字显示在她的视域中,然后她通过手势和眼球运动进行修改。从实用角度来看,她是会写字的。”

但记者发现,如果不用辅助软件,妮可自己拼写单词就有困难。“对她来说,英语变得有点像一门第二语言,”记者记述道,“说得很流利,但基本不会写。”英语是父女的通用语,尽管妮可能够生成和破解英语,但在叙述者看来,两人使用的书写技术不同,这标志着两人之间存在着一道远为深广的鸿沟。

记者对Remem技术的探究中夹杂着他对父女关系困境的反思。在他残缺的记忆中,他曾努力修补与女儿糟糕的关系,他一直是一个好爸爸,总是受到女儿不公正的隔膜对待。心中虽有疑虑,但记者还是开始用Remem来探索自己的记忆。为此,他需要联系自己认识的人,请他们用自己的生活日志来填补他自己的“卢德主义”(注:本为19世纪英国工人捣毁织布机的运动,现泛指反对新技术的做法)数据库。随着Remem技术将资料整合完毕,他发现了令他震惊的真相:关于他养育女儿的经历,他一直在对自己撒谎。


“新工具孕育了新的读写能力,后者又会产生新的认知、情感与叙事形态。”


吉金基的故事同样揪心。对他来说,文化冲撞发生在他试图用欧洲人的书面文献在部落法庭上解决纠纷,让口头历史与书面资料当庭对质的时刻。他带着否定了族人主张的证据回到了他们中间,但长老耸了耸肩问他,“你是学文书学过了头,把身为蒂夫族人的意义都忘了吗?”

吉金基很快明白,文字中记录的事实真相是确切的,但归根结底不利于自己的社群。吉金基反思道,书写行为已经开始按照文字中蕴含的欧洲文化形态来塑造他自己的思想了,于是也开始让他疏离了自己的信念与当务之急。

这些真相——事实和情感的真相——形成了一门比较研究,这门研究正是小说中对读写能力和记忆的文化表达的基础。在小说结尾,记者揭示了吉金基的故事是自己编的,情节略有历史本原,同时融入了他想象出来并通过叙事呈现的丰富情感,目的是强调人工记忆的局限性。

记者说自己和吉金基都是“认知赛博格”(cognitive cyborg),两人的心智都得到了文字以及新老回溯技术的拓展。伴随着变迁过程,新技术及其引发的新读写能力有得亦有失。蒂夫族的口述故事确证了人类身体活泼泼的在场——“他告诉你这个故事是用了自己整个的身体,你理解这个故事也是一样。”尽管文字让吉金基能够考察遥远的过去,但它也缺失了这种丰满的具身性元素,以及这些元素与他的文化之间的生动关联。

《双面真相》探讨了技术是如何划定我们讲述的故事——包括讲给自己的故事和讲给别人的故事——的轮廓。同时,小说还强调了我们讲述的故事也在塑造我们用来讲故事的技术。在记者的讲述中,“人是由故事造成的。记忆并不是我们生活过的每一秒钟的无偏见的累积,而是我们用选择出来的时刻拼凑起来的叙事。”最后,特德·姜预言道,这种综合回溯形式是有局限性的,而且我们需要通过创造性的文化实践来激活这些认知拓展工具。




通过记录外在于人类心智的信息,书写系统孕育了新的知识分类和提取方式。人工智能与大数据的发展已经大大提升了读取能力的规模与自动化程度,远远超出了人的感知范围。

尽管Remem还是一种想象中的技术,但它对资料搜索与建立索引功能的强化不禁让人想起机器学习中的对应操作。作为一种智能程度日益提高的外部记忆形式,人工智能可以放大书写系统对人类心智物理边界的拓展作用。

然而,正如《双面真相》所描述的那样,读写机器将思维延伸到了这些机器的物质边界以外。作为一个分布于大脑、身体和环境中的认知生态系统的一部分,这些技术同样体现于社会文化世界之内。新工具孕育了新的读写能力,后者又会产生新的认知、情感与叙事形态。

早期的书写系统为创作交流的新模式打下了基础。人工智能或许也是如此。我们用人工智能讲述的,我们讲述的关于人工智能的故事——以及真相——能帮助我们调整与整合人工智能技术,使其服务于人的表达活动。有一天,人工智能或许还会成为我们的伙伴,共同书写现在还想象不到的故事。


孙艺萌 | 编

(本文原文为英文,出自博古睿研究院出版的Noema杂志,发表于2020年12月3日。版权所有,未经允许请勿转载)