郑达、杨晓雷:智能机器的视觉生产与AI艺术

郑达 杨晓雷

2021-05-20 23:54:28

已关注

在全球化的日常生活中,由智能机器生产的图像变得越来越普遍,图像在算法的驱动下,让机器的行为呈现出智能化的表现。智能机器的视觉生产改变了社会中个体观看和认识世界的模型。

各种机器设备积极地介入社会系统的运行框架中,机器视觉以一种非自然的方式观看着世界,并将它们所看到的以图像形式呈现给人类,观看者正在学习并且越来越习惯这种观看方式。本文基于科学观看的历史,分析机器视觉的演变过程和特点,以及在艺术创作领域,艺术家如何利用智能机器的视觉生产,打开我们认知世界的各种新的方式。


一、科学观看与科技图像的历史科学的发展一直都在影响着人类看待世界的方式。对比艺术与科学的发展历程可以发现,不同时期艺术流派的产生都能找到其对应的科学理论知识。当人类开始借助机器去观看世界时,机器视觉侵入了人眼,人类开始进入知觉自动化的时代,也是“合成视觉”(synthetic vision)的时代。

机器的视觉也同样因为科技的发展进行着演变。在《机器和媒体的本体论》一书中,李维·布莱恩特(Levi R. Bryant)提出了一种理论:所有实体都是以机器的形式存在的。①这是一种扩展的理论。基于这一理论,我们可以将机器视觉的历史往更早的时期延伸和扩展,并以科学和医学中的影像作为线索,讨论机器视觉生产的应用及变迁。在科学与医学的漫长历史中,“观看看不见的东西”是一个反复出现的母题,而 “看不见的东西”在科学观看的历史中也非一成不变。

19世纪,摄影技术被发明,机器视觉生产的图像开始走进人类的视野。自此以后,照片被视为科学和医学上的一种强大媒介,可以为各种现象和实验提供视觉记录,并且是一种强有力的凭证。除了摄影,显微镜也帮助科学家看到了微观的世界。物理透镜的成像方式除了会运用到科学观看中,同样也会被艺术家用作艺术创作的工具。在这个实证主义时代,人们认为机器可以帮助我们将“看不见的东西”看得更清楚、更深入。

到了19世纪80年代,X光被发明后,机器的视觉为人类观看自己的身体提供了全新的视野。“看不见的东西”不再局限于物体的表面轮廓。20世纪,电子计算机断层扫描(CT)、正电子发射型计算机断层显像(PET)、超声波成像和核磁共振造影(MRI)等技术的相继出现,让我们意识到机器的视觉已经发生了本质的改变,科学家开始将测量的数据可视化。

“看不见的东西”已经完全脱离了人类的视觉系统。例如医学上的超声波影像,这项技术是利用声波来测量内部柔软组织的分界线,然后将测量结果转变成动态影像,或者说是利用电脑模拟技术以视觉方式将声波在体内运动的速度和轨道再现。

在这个案例中,数据被再现,形成了视觉影像。这些将数据可视化的机器被发明后,我们在科学和医学影像中观看到的东西,有些并不会被归纳到人类的视觉领域中。因此,由机器视觉生产的影像开始形成自己的专业领域,这些专业的影像必须由受过训练的专业人员,以专业术语做出解释,我们才能理解。与19世纪科学家致力发展显微镜这类仪器不同,20世纪的科学家潜心钻研观看的技术,并且观看的对象或过程很难视觉化,或根本不具备光学的特质。此时,数据可视化的地位扶摇直上,机器的可视化窗口开始作为翻译平台,与人类的视觉系统进行交流。

从20世纪80年代中期至今,随着计算机处理数据的速度不断加快,机器的视觉目前已广泛应用于动画、影视娱乐、科学计算可视化等各个领域。数据的可视化窗口已变得随处可见,我们似乎不再对机器视觉生产的图像感到陌生。但实质上机器的视觉当下是在一个“不可见的系统”下运作的,这个系统对绝大多数人来说其实并不熟悉。

二、由“不可见的系统”产生的机器视觉由机器视觉生产的图像目前成了我们视觉信息的主要来源,机器图像无处不在。但我们应当清楚地知道:机器视觉的生产已经变得不可见,不可见指的是机器图像的存在方式和处理方式是不可见的。数字图像不仅是肉眼可见的,它们还是不稳定的实体,通过机器持续不断地计算而存在,并以不可见的形式被机器快速地读写和传输。

这样的形式之所以可行,是因为以数据和信息的形式对图像生产、存储和传输的机器在不断增强。大量的数据会在机器中通过算法进行驱动,也就是说只有在特殊情况下,人类才能在短时间内看到它们,它们大部分时间是以一种非实质性的机器形态存在的。我们无法感知这些数据,除非数据被转化为人类可认知的图像。从机器的视角,图像被解读为信息,它们是以一种与人类截然不同的方式理解图像的。数字图像基本上是机器可读的,与人类无关。

这一事实具有重大的意义,它可以实现视觉的大规模自动化,并且以前所未有的方式和较小的规模来行使更大的权力。在算法的驱动下,机器的视觉被赋予了智能。它们可以自主地处理数据信息,并呈现观看者当前需要的信息。此时,算法就成了机器与人沟通的媒介,在人与机器之间建立了更为复杂的联系,这联系不仅是看与被看的关系。例如数据的跟踪与收集算法构建了人们的“隐形的数字身份”,并实现了机器视觉对现实世界中的物体进行空间的调度。

例如“滴滴出行”软件,当人们有打车的需求时,机器视觉系统智能地充当着将用户与司机联系起来的纽带,用户和司机因此产生了有目的的空间位移。车辆中的实时监控也在保障着司机与用户的生命和财产安全。在智能的机器视觉系统中,机器自主地收集信息、处理信息、呈现信息,机器观看着世界,同样也注视着我们。

移动手机的拍照功能使图像记录的过程简单方便,并以数据的形式上传至网络。据统计,在美国每两分钟拍摄的照片比整个19世纪照片的总和还要多。我们正在不断接收着各种机器为我们展示的图像,也在学习如何理解这些视觉元素,以便快速有效地感知世界并获取信息,同时这些信息又反过来塑造了我们理解世界的模型。

艺术史教授乔纳森·克雷里(Jonathan Crary)从更宽泛的历史角度撰写了大量关于人类视觉作用的文章。他认为,传统意义中人眼最重要的功能正被技术设备所取代,图像的概念将转变成数据和代码,而不再参考以光学的方式感知世界或者任何人类观察者。④由“不可见的系统”产生的机器视觉正在对人类的视觉系统进行入侵。从历史上说,艺术家理解图像的能力要强于其他人。敏锐的观察力和丰富的感受力让艺术家们的视角紧随科学甚至超前于科学,同时会将自己的感知借助全新的艺术创作方式进行表达。

三、AI艺术与机器视觉在艺术家以人工智能(Artificial Intelligence,缩写AI)为工具的艺术创作中,与技术开发者不同的是艺术家会更重视这些机器学习背后的主观存在,并反思和试图利用这些隐喻性的存在来建立数据训练集,通过艺术作品展示机器视觉系统中种种无形的隐喻、主观性,甚至偏见,表达对某个问题的反思、意见,并将这些思考在作品中展示并传达给大众和社会。

特雷弗·帕格伦(Trevor Paglen)的艺术实践有很长一段时间都在处理不可见的图像的问题。在开发人员和工程师的帮助下,他使用算法来制作艺术品,并质疑机器是如何看待我们这个世界的。在传统的机器学习中,机器通常会被输入关于一个或多个特定对象的大量图像,机器被训练,并学习如何对特定实体或现象的视觉特征进行分类。

在这一过程后,机器可以分析新的视觉材料,如果某个视觉特征符合机器的理解,机器就可以识别和标记它所看到的东西,而不是让计算机解释新的视觉特征。特雷弗·帕格伦和他的团队则逆转了这个过程。在他的《反向进化的幻觉》系列作品中有两个联合的人工智能系统,图像从这两个系统的交互中产生。

第一个系统是一种图像识别算法,特雷弗·帕格伦给它提供了文学、哲学和释梦等领域的图像,以便它能够识别出其中的模式。第二个系统是一个能生成图像的人工智能,它能在没有外部刺激的情况下创造出形体,但在机器学习的语境中,这被称为幻觉。两个系统交换图像、优化图像、生成软件,直到图像识别算法能够识别图像中的主体。

在特雷弗·帕格伦的作品中,机器被要求根据它对一个特定类别的理解来生成新的图像。通过这种方式,机器通过图像来表达自己的认知。这种表达在人类看来虽然是抽象的,但我们也可以从机器生成的图像中窥视到其想要表达的内容,因为机器被赋予了人独有的方式去理解图像,并以机器自己的方式生成人类可以理解的图像。

例如《反向进化的幻觉》系列作品中的吸血鬼图像,对于这样一个只存在于文字描述中的形象,我们会惊讶地发现自己竟然与机器达成了共识。《反向进化的幻觉》系列作品让我们得以一窥机器是如何感知世界的,开启了对智能机器视觉的探索。我们去推测和探索机器理解世界的过程,这一过程是我们看不到的,类似于人类的意识。这件作品引发了我们的思考:绘制这些图像的机器有自己的意识吗?

我们开始关注这些超出人类感官范围的事物。艺术家借助机器视觉感知世界的同时,通过艺术作品让艺术欣赏者审视其理解世界的方式。视觉在这个语境中应被理解为一种被构建的东西,这种构建是与权力联系在一起的,艺术家在自己的作品中拥有至上的权力,借助机器构建了新的视觉系统,也引发了观看者如何看待以及理解视觉世界的问题。

这一点又会来影响我们的现实,影响我们如何理解自己,理解社会和权力的结构。克里斯蒂安·米欧·洛克莱尔(Christian Mio Loclair)是二进制华尔兹(Waltz Binaire)艺术工作室的创始人。二进制华尔兹是一家致力于艺术与技术交汇的创意工作室,探索“人类的欲望与尖端技术所发生的诗意的碰撞”。 该工作室的人工智能装置作品《自恋者》(Narciss),是一台完全裸露的机器人,机器人的身体—GPU、CPU、硬盘驱动器、散热器等—完全暴露在人们的视野之下,但它不会理会身边的一切,而是通过自己的视觉系统专注地看向面前的镜子,从不同的角度和视野来观察自己的“身体”,以抒情的方式描绘了对自身的无尽解释,并以叙事性的文字在自己身后的屏幕上呈现。

例如它看到自己身上许多细小元器件的排布,它会将其称为夜晚的城市;看到自己的“半身像”,它称之为一个男人看着一台笔记本电脑等。该艺术体验的目的是让观者看到一种人工智能,这种人工智能的唯一目的就是进行自我审视。我们看到了一个似乎拥有自我意识的人造机器,它正在“照”着镜子,以“自恋”的语句对自己进行自传性的描述。

精神分析学家雅克·拉康在他的镜像理论中指出,当我们在婴儿时期第一次在镜子中看到自己时,我们才在自己的意识中把自己构建成独立的主体。《自恋者》模拟了这一过程,它在以叙事的方式描绘着自己的“身体”。

这是艺术家对机器自主意识的一次探索,也让我们理解机器视觉中的世界,同时反思人类视觉系统中的世界是否可以从新的视角理解,从而得出不同的结论呢?这也促使我们重新审视我们存在的理由。低科技艺术实验室在2019年创作的人工智能动态装置作品《机器的皮肤》使用机器学习的方法,模拟自然,在机器学习之后会有一个预判,即预判下一时刻的风速和风向。

该作品首先收集风速和风向的数据,然后介入人工智能系统进行学习特征的抓取,紧接着每隔一秒搜集一个数据,每天作为一个数据包,形成它的训练库。再用监督式学习的方式建立一个数据库,并构建机器动态装置,将风速和风向的预判可视化,随着时间的积累,六个点位会发生三维空间的位移:一是当决定了机器的状态后,整个作品会发生形变,表面的柔性材料会被六个步进电机的点位顶起;二是位于柔性材料下的六个点位的运动随着时间线变化。

《机器的皮肤》以机器感知自然的方式收集风速和风向的数据,以机器学习的方式理解自然的数据,再预判未来的风速和风向,对于预判的视觉化展示也不再匹配人类的视觉系统,而是由六个模拟机器的神经元组成的机器皮肤将风速、风向的预判可视化,整件作品是在机器的深度参与下形成的。

该作品将数据获取、数据处理和数据呈现的方式脱离人类感知世界的模型,从机器的角度再现机器对自然的模拟和融合,是对未知的机器世界的探索。机器脱离了人类赋予的目的而存在,按照自己的方式做自主性的运动,观看者在感受人工智能机器的同时反思人类与机器之间的关系。


小结

科技让智能机器视觉的生产不可见,我们观看世界的方式也在被机器延伸和改变。传统的感知形式会继续存在,但智能机器视觉的生产、传输等新技术正在取代传统的感知形式,作为可视化的主要模式。这不仅影响着我们如何看待和理解这个世界,也影响着社会进程和制度的运作。AI艺术从超前的视角,借助科技与机器,作为一种创作方式,以艺术的形式揭示了这一不可见的过程。


注释:①Bryant Levi R., Onto-Cartography:An Ontology of Machines and Media, (Edinburgh: Edinburgh University Press, 2014), p. 15.②Trevor Paglen, 'Invisible Images: Your Pictures Are Looking at You', Architectural Design, 89 (2019).③Megan E. Eatman, 'Unsettling Vision: Seeing and Feeling With Machines', Computers and Composition, 57 (2020).④Jonathan Crary, Techniques of the Observer, (London: Routledge, 2006).


*本文刊登于《艺术当代》2021年第1期

0条评论