人工智能绘画：计算机想象力的天花板？-数艺网

资讯: 展览资讯大型展会灯光节大型盛典赛事中标捷报产品快讯热门话题艺术节活动演出新闻数艺报道俱乐部签约

观点: 大咖专访观点洞察书籍推荐吐槽设计观点企业访谈问答趋势创新论文职场方法薪资报价数艺专访

幕后: 幕后故事团队访谈经验分享解密评测数艺访谈

干货: 设计方案策划方案素材资源教程文案资源 PPT下载入门宝典作品合集产品手册电子书项目对接

人工智能绘画：计算机想象力的天花板？: 原创 2022-06-22

文章的开头，先来让我们做一个测试，下面哪一幅绘画是AI的创作？

A．一张白纸，上面印满了XX。

B．一张绿白相间的网格纸，上面有雾状的紫色斑块

C．一张帕拉迪奥神庙的图片

左右滑动查看选项

是不是光看描述已经无法判断？

或许2022年这个问题的答案是：
每一条描述都可以成为一幅人工智能生成的艺术作品。

加速爆发的AI绘画系统

AI艺术创作一直是人工智能世界里一个细分的分支。在AI系统占领高地之前，工程师和艺术家就一直在探索如何让机器人画画。

PumaProject是九十年代利用java脚本编写的一个机器人系统，允许任何万维网用户在线生成艺术创作。

华盛顿艺术家Pindar van Arman从00年代起也在研究如何让机器人以更快的速度替自己绘画。他连续设计了绘画系统Bitpaintr、Cloudpainter和机器人Artonomous。

2010年代，AI绘画从潜伏期进入加速爆发期。

Google工程师 Alexander Mordvintsev 2015年创建了计算机视觉程序Google Deep Dream。Alexander希望AI创作的作品有某种绘画风格，他让神经网络通过错视性的算法来故意夸张一幅图片中的某些图案，以此产生极度迷幻的效果（至少意图如此）。

Google Deep Dream《Untitled》

在现在看来，这些都不是科学怪人一时的疯狂之举。至少早在没有机器视觉的年代，工程师和艺术家就希望能让机器人画画。

1960年代末，英国艺术家Harold Cohen使用GOFAI算法设计了AI绘画的初代系统AARON。Cohen从60年代到2000年一直在设计这款程序。AARON可以画出简笔画的人像和简单的三维空间，还可以做一些颜色搭配。但由于缺乏对于大脑图像认知的基础数据，Cohen没有足够多的图像数据“喂”给人工智能。AARON在学习绘画的路上停滞不前了。

Harold Cohen在2002年用AI生成的肖像绘画

同样，Matthew Stein设的Pumapaint也没有激起过多水花，大部分用户并没有对这个系统投入持续的兴趣。艺术家Pindar van Arman花费大量时间试着将机器人Artonomous的作品推给画廊和博物馆，甚至与肖像摄影师合作，但屡次宣告失败。

Pumapaint绘图页面和机器人根据指令创作的绘画

Pindar van Arman的NFT作品，AI Imagined CryptoPunk #2, 2021

Pindar van Arman和摄影师Kitty Simpson，中间是Pindar设计的绘画机器人Artonomous；Pindar用他基于GAN（对抗生成网络）设计的AI系统在Kitty拍摄的系列肖像基础上再创作

AI绘画直到2018年Obvious艺术小组用“算法”生成的《爱德蒙·贝拉米肖像》在纽约佳士得拍卖行以43万美金成交时才崭露头角。然而即使拍出高价，彼时小组掌握的算法还没有能力精细模仿古典油画肖像的细节；训练算法的图片只有大约1.5万幅。Obvious顺应算法尚不完全的发挥，加上人工干预，制作了这幅“未完成”的肖像。

也是大约在同一期间，纽约艺评人Jerry Saltz推出一档名为“AI艺术点评”的节目。点评对象就抛开Pindar van Arman、Google Deep Dream以及Tumblr网友开放的人像生成算法。从审美的角度看，这些AI绘画实在过于平庸。Saltz在节目结尾号召：计算机，释放你的想象力。

2021年，OPENAI和Google Colab相继放出“大招”，以文本指令（textual prompts）生成图像的AI系统大放异彩，AI绘画真正向未来迈出一步。

主流的文字指令AI绘画工具有最早出圈的Disco Diffusion、擅长设计的Midjourney、以及功能齐全的DALL-E 2。

与基于计算机视觉的Deep-Fake系统不同的是，这几种系统适用CLIP（对比语言－图像预训练）方法训练，它们对于文字指令和抽象风格的把握达到人类要通过思考才能得到的程度。人类只需要填写一句文字指令，就可以生成对应的图像。生成图像进入了“用嘴做图”的时代。

AB君盘点了几个平台生成图片的特点，三个平台都在测试阶段。

最早出圈的AI绘画系统
DISCO DIFFUSION

作为三大AI作画工具中最早出圈的Disco Diffusion，刚刚推出时一炮而红。各大论坛甚至总结出一套关键词图谱，专门测试AI对不同大师视觉风格的理解。

“一幅弗朗西斯·培根画的美丽的睡莲图，Artstation近期热门”

列表发起人：proximasan & surealiabs

列表共创者：EErratica & KyrickYoung

Disco DIffusion是GitHub 的开源项目，在Google Colab中以代码的形式呈现。Disco Diffusion显然利用了Google Art数据库中的海量作品进行了大量训练，非常擅长模仿艺术家风格出图。是目前创作最有“大师范”的一款AI。

只需要敲几行简单的代码，就可以改编Disco Diffusion生成图片中不同元素的权重。对于插画师和代码小白也比较友好。

缺点是上手有门槛，需要学点简单代码。运行效率低且耗内存、而且经常卡顿掉线。连续生成高分辨率的图片要从一个小时到需要数十个小时不等。

Disco Diffusion默认画作：由 Greg rutkowski 和 Thomas kinkade 绘制的一座奇异灯塔的美丽画作，它的光芒照耀在汹涌的血海中

Disco Diffusion用马格利特风格画的画

Disco Diffusion；“星空下的向日葵，梵高风格” 图片@Simon_阿文

Disco Diffusion和DALL-E-2对同一条指令“巴勒贝克大神庙入口处景象”的不同反应

万能的作图工具
DALL-E 2

DALL-E 2是由OPENAI开发的第二代DALL-E。DALL-E 2 就像机器人瓦力（WALL-E）和萨尔瓦多·达利（DALI）的结合一样充满梦幻。这是一款强大的AI作图工具，最大的优势就是可以完成设计师在PS里才能完成的功能：修图、改图、抠图、替换图片中的特定内容。除了模仿绘画的笔触、CG风格设计，还可以假造照片。时间只需要5分钟左右。

DALL-E2的各种创作

泰迪熊在水下用 1990s年代的工具研究人工智能

DALL-E 2 “戴珍珠耳环戴少女”

马蒂斯风格下象棋的人形机器人油画

“有身体的蒙娜丽莎”

DALL-E 2 生成 ”克利姆特风格一对情侣接吻“

DALL-E 2 生成照片的本领也极度不俗。图为“一个传统风格的花店正面，店面是油画绿和干净的白色”

适合多元风格的
Midjourney

Midjourney是Disco Diffusion研发人员之一创造的AI系统。优点与DALL- E 2类似：出图快，适合各种风格的图片都比较擅长。

缺点是这些图片的技术感都比较强，更像CG、电脑设计的作品，不太具有Disco Diffusion追求的“画意感”。

Midjourney “星空下的向日葵花海” 图片来自设计师 @Simon_阿文

AI也有决定绕过的区域。早在2017年，英伟达就使用生成网络系统制作假的名人照片。而出于法律考虑，所有AI系统都不支持生成精细的名人面孔，以避免可能引起的侵权纠纷。

譬如网友尝试用Midjourney把超模Kate Perry的脸安在埃及狮身人面像上，AI的失误其实是开发者的“有意为之”。

计算机的想象力有天花板吗？

面对如此强大的绘画工具，一般会产生两个疑问：艺术家和原画师这类创造力的职位是否又会被机器替代？AI创作的绘画又是否算作艺术？

我们先来看一段经典的艺术史观点。

艺术史学者Arthur Danto在80年代发表了一篇文章，名为《艺术的终结》。Danto以安迪·沃霍尔六十年代用Brillo肥皂包装盒做的经典装置《Brillo Boxes》为例子，指出当代的艺术和非艺术已经无法从外表区分。一件东西是否算作艺术品全赖于艺术家能否用某个“概念”去指认它。就像杜尚将小便池送到博物馆一样，艺术家的身份已经从创作者变成一个提名人，获得他“提名”的作品就可以成为艺术品。

Danto的观点与其说是对于艺术历史的沉思，不如说是学者的沉思。在Danto看来，艺术史应该像黑格尔理解的历史唯物主义一样反映时代、符合规律。但事实往往出乎预料，当代艺术进入了无法预测的时代。即使艺术已经没有一个明确的定义，人们依然需要艺术，这就带来了被动的多元主义。

那么艺术终结了吗？Danto在文章结尾解释：“艺术的终结”其实是艺术史单一线性叙事的终结，艺术的历史不再是一段进阶式的旅程。20世纪60年代的艺术家不再追求“透过现象看本质”——他们并不希望靠发明新的“再现自然”的创作手段来反映主客观世界，而是去选择就“什么可以成为艺术”做各种各样的实验。

九十年代，艺术家韦德·沃顿和克里斯托弗·伍尔发明了一种“过程艺术”，沃顿把画布放进打印机里，让打印机上的油墨自由创作。墨迹脱印的这些时刻被沃顿当作创作的“机缘巧合”记录下来。这些参差的状态呈现了机器代替人生成作品的过程本身，也呈现了机器工作状态的不稳定性。

Wade. Guyton, 2006

“过程艺术”像对于一个更早之举的致敬。五十年代最经典的创作之一是罗申伯格和好友实验音乐家约翰·凯奇的作品《自动车轮胎印》（1953），罗申伯格指挥凯奇开着越野车轧过一叠纸，留下一道墨痕。这背后的创作似乎都在说明：艺术家希望一件作品中“笔刷”的出现越少越好。艺术家使用创作媒介的方式越是“间接”，作品就显得越具有原创性。

无独有偶，AI艺术暗中耦合了这一点。就像当代艺术总是将“机缘巧合”（chance）视为艺术本质的一部分一样，AI创作也会有掉SAN值的时刻。

在谈到机器画家和人画家有什么关系时：Pindar van Arman简单地回答：仅仅因为机器可以做到人能做到的事，并不会使我们的创造力失去价值。一个有创造力的人工智能艺术家，如果它不断进行，它最终会达到自己的“究极形态”，但它只是会成为另一个艺术家，而不会替代人类艺术家。如果人工智能艺术家不够有趣，那么它们也会被忽视。

AI并没有挑战人的想象力，而是影响了人的创作规则。每一只算法生成的“神奇动物”背后都有他们人类驯兽师的多年调教。

附本文开头小测试的作品名称：

图1：美国艺术家Wade Guyton的《无标题》

图2: Harold Cohen《Close-Up IV》, 1966年

图3: DALL-E 2 根据“一座帕拉第奥式建筑入口处的风景“指令画的画面

参考文献：

https://sci-hub.hkvisa.net/10.1145/3359852.3359865

Poltronieri, Fabrizio Augusto&Hänska, Max, From GOFAI to GANs：Technical Images and Visual Art in the Era of Artificial Intelligence， ARTECH 2019, October, 2019, Braga, Portugal

艺术商业编辑部

文：杨宇青

图片：网络

阅读原文 * 文章为作者独立观点，不代表数艺网立场转载须知: 本文内容由数艺网收录采集自微信公众号艺术商业 ，并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源：数艺网” 并附上本页链接：如您不希望被数艺网所收录，感觉到侵犯到了您的权益，请及时告知数艺网，我们表示诚挚的歉意，并及时处理或删除。

数字媒体艺术人工智能绘画 AI 绘画系统科技艺术

30010