- 0
- 0
- 0
分享
- 人工智能 | AI 绘画元年:几秒作画到更精更准,科技大佬争夺AI“画语权”
-
原创 2022-06-08
A
I
绘画元年
没有参考图像,也并非简单的两幅图像的拼接融合,而是真正基于文字描述,在充分的想象力下,从无到有地进行了绘画创作......
近一年,AI 绘画工具井喷式出现,迭代速度极快,背靠网络图库,再加上惊人的识别能力和融合速度,AI 总是能在极短的时间内产出想象力惊人的绘画思路和结果。
△“Imagen”的作品
DALL·E 2
首先,认识一下 OpenAI,这家总部位于旧金山的公司早在2021年1月5日就创建了其第一个AI 绘画系统“DALL·E”。
2022年4月,该团队推出了名为“DALL·E 2”的最新系统,该系统可以生成更真实、更精确的图像,分辨率提高4倍。
“DALL·E 2”不仅是一种“生成模型”,它可以创建复杂的输出,而不是对输入数据执行预测或分类任务,升级后的“DALL·E 2”在创意能力,艺术性,精致度上都要高出“DALL·E”很多。
△吼叫的猴子
对比下“DALL·E”与“DALL·E 2”生成的图像:
△日出时分,坐在田野里的狐狸(莫奈画风)
“DALL·E 2”还可以对现有图像进行编辑或创建图像的新版本。这意味着您可以为名画赋予不同的风格,甚至可以为蒙娜丽莎赋予莫霍克风格。
△《蒙娜丽莎》(莫霍克风格)
而且,“DALL·E 2”生成后的图也具备一定的完整性,更像是一幅人类的作品,而不是粗糙无章法的 AI。
△乔治·修拉的《大碗岛上的一个星期日》
AI 系统是通过在图像及其文本描述上训练神经网络而创建的。通过深度学习,“DALL·E 2” 可以识别单个对象并了解它们之间的关系。
△古斯塔夫·克里姆特的《吻》和其人工智能转换
“DALL·E 2”已经学会了图像和用来描述它们的文本之间的关系。它使用一种称为“扩散”的过程,该过程从随机点的图案开始,当它识别出图像的特定方面时,逐渐改变该图案朝向图像。
△约翰内斯·维米尔的《戴珍珠耳环的女孩》现在有许多不同的面孔
Imagen
AI 作画这件事,最早便源起于 Google。2015年,谷歌推出“DeepDream”,开创了AI 根据文本生成图像的先河。
“DALL·E 2”才新鲜出炉一个月,5月24日,Google Research 推出了一个具有类似功能的 AI 图像生成器 “Imagen”,让机器的想象力又到达了一个新的高度。
△多伦多的天际线上用焰火书写着谷歌大脑的标志
其能够根据输入的文字描述生成油画、照片、绘制和 CGI 渲染图像,不管多长,多具体,多不符合现实逻辑的离奇描述词,都可以精准地从文字生成真实准确的图像。
△陈列莫奈画作的美术馆被水淹没,机器人正在使用桨板划行
相比“DALL·E 2”,“Imagen”所带来的图像真实感更强,对于语言理解的准确度也更高——号称“前所未有的写实感和深度的语言理解”。
△一对机器人夫妇在埃菲尔铁塔的背景下享用美食
给出同样的文本提示,“Imagen”可以生成不同类别的图像。比如下面这些图中,各组图片在物品的颜色、空间位置、材质等范畴上都不太相同。
△同样的文本提示,生成不同类别的图像
对于涉及颜色的文本,“Imagen”生成的图像也优于“DALL·E 2”,“DALL·E 2”通常很难为目标图像分配正确的颜色,尤其是当文本提示中包含多个对象的颜色提示时,会容易将其混淆。
△“一本黄色书籍和一个红花瓶”(上);“一个黑色苹果和一个绿色双肩包”(下)
在引用文本的生成图像方面,“Imagen”的能力也明显优于“DALL·E 2”。
△从带引号文本生成图像的比较
技术上,“Imagen”的颠覆性在于——使用纯语言模型只负责编码文本特征,把文本到图像转换的工作丢给了图像生成模型。
语言模型部分使用的是谷歌自家的T5-XXL,训练好后冻结住文本编码器。图像生成部分则是一系列扩散模型,先生成低分辨率图像,再逐级超采样。
△输入“一只戴着蓝色格子贝雷帽和红色波点高领毛衣的金毛犬”后Imagen的动作
目前出于 AI 伦理、公平性等方面考虑,“DALL·E 2”和“Imagen”各自都在论文里有大篇幅涉及风险、社会影响力的内容。
“DALL·E 2” 选择了内测模式,而“Imagen”还在做进一步研究和规范,等到确保 AI 不被滥用之后再择机公开。AI 绘画工具的惊艳表现带给人们对 AI 艺术创作的思考和审视还有很多很多。
参考资料:
https://www.youtube.com/watch?v=qTgPSKKjfVg&t=14s
https://imagen.research.google/
————
商务合作
19907146972(微信同号)
内容转载
-
阅读原文
* 文章为作者独立观点,不代表数艺网立场转载须知
- 本文内容由数艺网收录采集自微信公众号全球数字光影艺术创新网络 ,并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 如您不希望被数艺网所收录,感觉到侵犯到了您的权益,请及时告知数艺网,我们表示诚挚的歉意,并及时处理或删除。