演讲分享｜邓博《AIGC与公共艺术装置创作的结合》-数艺网

视频
图片

演讲分享｜邓博《AIGC与公共艺术装置创作的结合》: 原创长期 2024-02-26

案例介绍

主持人：让我们掌声有请飞扬萝卜数字公共艺术机构创始人邓博，他今天带来的演讲主题是《AIGC与公共艺术装置创作的结合》。

邓博：首先很感谢苏州高新区以及数艺网创造这次跟各位老师交流的一个机会。我是飞扬萝卜的创始人邓博，来自北京。飞扬萝卜是一家专注于在公共空间进行大尺度数字交互装置创作的机构。接下来由我代表我的团队跟各位老师去汇报一下这一年的过程中我们在AI真正的项目落地过程中的一些应用以及理解。

我说的都是错的

首先先跟各位老师致个歉，就是——我说的都是错的。

坦诚地讲啊这句话不是说事后诸葛亮或者是说浪费大家的时间，因为之前的几位老师也在分享这个问题。坦诚地讲，目前在我观察到的，我们国内的一些行业从业者其实大多数还是属于AIGC的应用用户，也就是说属于应用端。至于刚才像程老师提到的说他的算力模型算法，其实对于一些做创意的studio来说它不太存在去干扰和自研的一种能力。所以呢，随着它模型的迭代的速度的加快，我此时此刻在讲的观点，其实有可能明天就完全是错的。这是一个点。

第二个点呢就是，因为我们是只专注于在公共空间做大型的数字艺术装置，所以说呢，它只限于我在我这个行业里边一年的一个理解和一个积累。

个人团队的AI观点

那下面呢，我们再讲。

首先是，如果我们用AIGC去帮助我们进行创作，那我们要去抽象地去总结出来AI 当下这个阶段的AI它的整个的内容产出以及说它的成果的一个逻辑概述。

我们认为啊，作为一个人，作为创作者的个人观点其实是“相对有限信息量小模型的整顿主观偏见”。这个是我们自己团队的一个认知，我就不过多去解释了，因为每个人的他的生长的出生的这个地域以及他的文化背景，还有他的宗教信仰，甚至他的国籍国别、然后性别，都决定了每个人对待同一个事物的看法——其实坦诚的讲不太存在客观的可能性，大部分都是主观偏见。

那为什么我们讲到AI观点是一个“相对无限信息量大模型整顿的主观偏见”，就是因为刚才程老师讲到的：就是大部分的语言语料和算法以及算力其实不在我们大部分人的手里，所以它的数学逻辑的判断也就决定了它必然也是一个主观偏见。

那下面呢，就是我们对AI整个——因为我们在创作之前，我们要对这个工具认知。

我认为对于创意工作者最主要的一个能力、区别于科学家和数学家最重要的一个能力，就是作为一个人，最重要能力是一个抽象的逻辑能力。这不叫抽象，总结就是目前大家都熟知的啊——AI其实是现在全人类在互联网上信息的平均知识。

为什么这么说？因为它的本质是在做模型拟合。也就是说，对人类自然语言语料数据进行模型匹配。当然在这里边现在有了多模态，但是所谓的图片视频的多模态，都是基于对语料语言的一种理解。

那接下来我再讲到说，它是根据数学逻辑和非逻辑的整合判断输出，那在这里边就必然会带来一个问题，也就是说在它整个逻辑模型不改变的情况下，以及它的数据虽然在不断的迭代更新但是数据基础不会变的情况下，它必然会带来它的不可预测性，还有它的随机性。

那这就是首先第一个产生，就是我们会将AI应用到我们整个创作AIGC在创作过程中，它用一个灵感启发的一个工具。这是我们工作中可能最初始的一个阶段。

那下面呢，就是说因为我们知道，虽然说我们把AIGC作为应用辅助工具，但其实整个的工作流的过程中，它还有很多看似很常规的一些工作，比如说PPT的设计啊、然后文字的文艺总结啊、然后以及PPT整个的内容、逻辑大纲的一些。所以说呢，AI作为日常的知识处理机这个可能是在当下最落地最应用的一个部分。

但是这里边有个很有意思的现象，我接下来的分享只是在当下我们做的测试，这个测试也比较新。

也就在上周，我们团队尝试用chatdoc去分享了一下我今天要分享的PPT的一个语义。本来坦诚的讲，我想偷个懒，哈哈，就是我们写完的结构想让它去给我总结一个演讲稿。但是出现一个特别有意思的现象，就是它在前半段，因为是我们团队自己根据经验和应用总结出来的词句，它前后没有强逻辑应用关系，所以出现了一定情况的胡说八道，这个大家也能看到。但是关于它后半部分呢，是因为我们是想去通过去学习和分享一个行业前辈他的这个作品，所以说呢，它的前后作品的描述是有逻辑性的且逻辑较为完整，所以它回答的还是相对正确。

那么其实在这个过程中呢，我们自己在创作的过程中，其实除了在把AIGC当做工具的时候，我们也在思考一个问题，就是——随着我们知识检索的这种方式的不同，你可以理解为越来越快捷，然后知识检索的这个成本越来越低，但是其实我们自己感知到在人机交互的过程中会存在人被归训的可能性。

我举一个现在大家天天刷的东西“抖音”，但是这里边其实对于创作者是很大一个bug。因为先不说它来源的这个真实性以及它是否是一本正经胡说八道，就在你快速检索它的过程中，其实是无意识无思考的。这个坦诚的讲，如果我是一个美工，我是一个PPT排版工作者，或者我studio是做非思考类的（工作），这种机器人做的人工日常这是没有问题的。但是对于创作来说，这是最大的bug，这是根基上的一个bug。

所以说呢，如果我们抽象的去理解机器智能的话，其实它的整个抽象逻辑是对物理世界的一个表征，然后进行映射，然后才是记忆应用学习。也就是说从这个层面上去理解，广义上，AI也是存在信息茧房。在这里我指的不是AIGC，就是AI也存在信息茧房。因为它喂的数据虽然在实时更新，但是它也是有限的。

那除了作为我们一个创作团队，我们要想获得除了通用大模型，比如说现在Google、然后open AI、Mata，然后还有文心一言之外，就是这些通用大模型给到的通用通用知识之外，能够真正的用于创作的这个模型。坦诚的讲，我们在尝试训练，但是对于一个没有数学基础和编程基础的studio来说啊，我们现在只是在探索的初期，在路上。

蔡国强：人工智能艺术计划cAIᵀᴹ

下面我分享一个蔡国强老师2023年发布的人工智能一个计划。因为什么，这个对于前辈来说，他已经进行了一个尝试，并且让我看到了一个大概的一个方向！

右侧的这一部分呢就是他训练的这个人工智能模型，他称之为【cAIᵀᴹ】，然后这个模型针对【cAIᵀᴹ】自主生成了一个自己的一个logo。那下面呢就是整个的这个AI模型，就是他创作AI模型，也就是他小模型的一个训练逻辑还有他应用的一个过程。

其实总结来说，他就是把他数十年的文字、图片和视频作为主要的语料，然后喂给了AI模型，喂给了这个机器设备，但是这是他的灵魂的东西，也就是说为什么这个东西输出出来，让你看上去他像蔡国强、他不像任何人。这是一个看似很灵魂很根基的东西，但是就像之前各位老师分享的一样，它的本质仍然是一个数学逻辑模型。

就我目前现阶段，这一两年的使用过程，我没有太多的感受到他有什么所谓的情感或者感情。但是在我们创作的过程中，如果一个作品，他的根基上是没有共情能力的，在我看来他的本质是失败的啊，就是看不懂。其实不重要，但如果你对他既不讨厌又不喜欢且都不存在一个中间态，那我认为这就是社会资源的浪费啊。这是当然，这是我的个人观点！

其实他的辅料是最核心的。辅料是什么？辅料是基于他喂养的主料的特定主题，然后实时用爬虫在互联网上捕捉跟其主题相关的一些图文信息，然后以外界的最新的信息来去补充他内部的训练主线。这是他的一个大的一个训练逻辑。

那接下来我分享一下蔡老师在整个应用过程中他的落地作品。他训练完之后模型的一个大家去看一下，他是否具有一个人物性格特征或者看似有思考性的东西。

刚才其中有个老师提到灵魂三问的问题，就是“我是谁？我在哪？我去哪？”。然后右侧的这个应该是我右侧，我右侧这绿色的字体啊，这是艺术家训练的模型所回答的答案。左侧这个大家应该都比较熟悉了，就GPT给的一个答案。其实不难去看出，就是右侧好像更觉得他是一个会思考的一个生命体或者是觉得他更像一个艺术家，而左侧给到的就是一个……坦诚的讲，他讲的还挺坦诚的，这是一个客观事实啊，就在当下来说它是一个客观事实。

那下面分享的就是这个蔡老师去创作将整个模型训练之后，他将他应用在作品的这个创作的全流程过程中的一个分享吧。

首先是必须是由艺术家先提出一个作品的创作构想，就是他去明确了这个场景的一个视觉语言以及他的元素，然后还有他在过程中的想要表达的情感，最终呢还要去给他辅助他的相关的社会资料，然后进行一个计算，模拟计算给出一个动态结果。那下面这个呢就是根据n次的这个模型迭代之后所产生的图片信息。

但坦诚的讲，当他出来的时候我的第一感觉就是还是挺有蔡国强老师的一个个人的创作方法论的一个元素，就是比较像烟火烧过的东西。因为他本身就想创作一个以屏风为主题，然后以烟火药作为工具的这么一个随机性产生的一个视觉效果，这种激励的东西。当然，当艺术家看到这个作品之后呢，希望说在这上面会有这种地球的这个倒影，所以他就手工的往上面去合了一张地球的一个影像，然后将这个影像呢再次输入给了AI，不出所料的话AI肯定会再给他一个种关于带有地球影像的这么一个图片。

但其实这不是重点啊，重点大家去对比一下他输给他的这张图片还有他回来的这张图片。虽然现在Majorney和stable Fusion可以在特定的训练，就是行业里边大家俗称叫炼丹啊，给stable Fusion去练自己的这个模型的丹，然后形成一个可控主题下的东西。但其实仍然还是会出现一些不太可控的一种随机性，我觉得也是它的魅力吧。这个是两方面去看。

然后下面的这个，就是上边是基于下面，在整个的作品创作搭建过程中通过摄像头将这个场景搭建的视觉实时捕捉，输入给AI，然后AI进行一个实时的一个视觉画面的一个结算的一个效果，那最后这一批呢，其实是这个作品最终呈现那一瞬间，就是火药爆炸那一瞬间。

就是通过这个作品，然后整个的这个创作应用过程，其实我们想分享的就是说——在这过程中，如果我们不是想简单的拿AIGC和通用大模型拿到一些所谓的通用的结果，那必然要经历的一个过程。

不管你懂不懂Python，不管你懂不懂数学逻辑模型，那你仍然还是要去核心要去训练自己团队的一个创作模型，哪怕你把它作为一个应用工具——这也是我们现在在做和尝试。

项目落地的尝试

那接下来分享的，就是我们实际在落地过程中我们团队在做的两个项目，给各位老师分享一下。

（第一个项目由于还在保密阶段，暂不宣发）

我们第二层的一个尝试。为什么要分享这个呢？因为这个作品2023年就是在苏州落的。是由苏州的工业园区和苏州照明协会还有中衡设计，共同联合主办的一个展览——艺术展览《光遇·光艺》。我们在这上面落的这个作品。

我们尝试，因为这个作品是我们艺术系列中的第一个。但是他并不是第二、并不是结束。所以说呢，我们把我已经落地的这个项目的一个文字概述，然后再加上在他过程中创作的一个哲学思考或者是叫创作方法论，然后以及我们最终作品落地之后拍摄的这个宣传片，然后我们把同样的这些图文字图片视频的这些语料，然后喂给AI 尝试，尝试去跟AI进行这种对话。然后看他能给到我们什么样的一个结论，能否支撑我们第二个作品的一个延伸或者是一个创意的这么一个落地。

下面呢，就是我们在二创过程中跟AI交流对话的一个录屏一个片段，在这里边其实还是挺有意思的。

我们在第一个阶段，是将图文信息给到，让AI试图去理解，但是不出意外的话，坦诚的讲，他给到的是一个通用的废话。就是他看到这个画面里边有什么东西就是有什么东西。

但其实这个肯定不是我们想要的。因此第二个阶段我们就给他输入了我们原来创作的一个概念，还有我们在过程中的一些思考的关键词，以及它在苏州提取了哪些地理文化元素，以及它穿越了哪些周期性的东西，提出来一些内核精神的东西。我们输入进去啊，希望他给到我们一些建议啊，但其实他给到之后的东西，还是一个通用的东西、比较废话的东西。因为在创作的过程中，我们不可能苏州有什么文化有什么元素，我们全部用上，创作过程中不是个简单的转义，更不是描绘的越细越好，这个也是刚才曾老师在分享的时候：我们画画并不是到最后画到最全它会更有创新意或是更有意境。

然后第三个阶段，就是说我们给了他的一些身份，比如你从一个建筑师或者是一个国际知名的一个很有已经形成风格化的艺术家，你怎么给到建议。慢慢的，随着他给到的一些，就是通过我们对话式的这种引导，其实我们发现一个最核心的问题——就是你到最后单纯的文字图片没有太多意义，仍然还是要输入他的创作观和方法论才能得到。

那经过我们n次的这个对话，然后以及去对他产生这种（怎么说呢，叫）批判，然后最终输出了一个我们认为还算能接受的一个结果。基于这张结果图，我们进行了第二部分的一个动画的一个生成，然后进行一个视觉的一个展示。坦诚的讲，还在接受的范围内。虽然它不是那么的抽象，但是从可落地性来讲还可以。

因此呢我们其实这个大的这个命题，是希望能够在苏州高新区，是否有这么一个场地、然后是否有这么一个公共空间，需要去做这么一个落位的一个畅想。