- 0
- 0
- 0
分享
- 基于美学计算的智能设计方法分析与启示
-
原创 2022-12-08
内容摘要
基于美学计算的智能设计方法能够模拟人类的视觉系统与审美思维并对图像进行美学价值的判断,让计算机能够建模更加复杂的设计任务,也让设计过程不断朝着更加自动化、批量化和个性化的方向发展。本文主要论述了基于美学计算的智能设计方法,包括设计知识与规则提炼以及设计方案生成的设计方法和路径,并对设计师如何应对基于美学计算的机会和挑战进行了阐述。
关键词:智能设计、美学计算、人机协同
互联网时代让计算机理解、识别图像,生成“美”的内容,是计算机与艺术设计学科交叉研究的一个热点,有着巨大的应用需求。在2005年欧洲计算机图形学会(EG)举办的第一届图形图像视觉计算美学学术会议上,美学计算的概念被正式提出,用于描述那些致力于运用计算机的计算方法去模拟人类的审美决策的研究工作。
1
关于美的计算
图1.《美的评价》中提到的S形曲线
图2.用S形曲线分析的绘画作品
计算机图像识别能力的提升为美学计算的发展创造了条件。2009年,斯坦福的李飞飞教授等人在2009年IEEE计算机视觉和模式识别会议上发布了Image Net数据集,用以检测计算机视觉能否识别自然万物。[5]2021年美国的Open AI公司推出了“Clip”图片生成器,Google公司推出了Google Image,这两个工作都是基于计算机视觉的图像创造生成算法。微软亚研院研究的nuwa-infination通过输入关键词,可以实现从设计描述到设计表达,在文本图像生成、文本到视频生成、视频预测生成等方面都取得了很好的成果。[6](图3)随着基于计算美学的图像生成技术日趋成熟,相关应用也越来越受人关注。例如,iPhone的应用根据美学评价自动推荐最佳照片,给用户推荐“精彩回忆”,为用户提供更好的照片管理体验;淘宝首页根据商品美学特征和用户喜好给用户推荐商品;大疆、剪映、花瓣等剪辑软件对视频素材进行自动评估,筛选优质的素材自动剪辑成短视频。广泛的应用也进一步推动了数据和算法的进一步成熟,促进了美学计算的发展,形成了从满足社会需求到进行相应技术研发,再到相关产业健康发展的良好互动。
图3.由NÜWA模型支持的8个典型可视化生成和操作任务的示例(图来自 NÜWA: Visual Synthesis Pre-training for Neural visUal World creAtion)
2
基于美学计算的智能设计方法分析
图4.基于美学计算的智能设计生成框架
1.设计知识总结&设计规则提炼:
设计知识总结与设计规则提炼是美学计算的核心内容,是设计师在美学计算中的工作重点。设计知识总结的典型思路是先把设计对象进行分类,总结描述可量化的视觉信息特征,再定义关键特征的视觉特点,将主要的设计知识符号化,最后把能表达设计对象的,复杂多样的设计特征量化为结构化的数据。
设计规则是设计师根据设计理论、经验等总结出来的美的一般规律。尽管美是一个主观性极强的概念,但仍存在一些被广泛接受、认可的规律。例如,公元前5年,波利克莱图斯提出在绘画中有关于“人脸的三庭五眼以及人的身高与头的比例关系”等美的规律。设计规则将已经量化的设计知识有序地联系在一起,指导智能设计过程或者约束智能设计的结果。设计规则提炼的方法是一个多学科交叉的方法,一般来说包括几方面内容:抽象和优化设计要素并进行分类,设定设计规范,寻找“美”与“计算”之间有意义的关联,构建有序的一一对应关系,制定主要设计要素间的组合与匹配规则。
在笔者参与的“虚拟人的形象设计”项目中,目标是让用户只需输入用户照片和部分信息,就能自动计算出与照片人物相似的卡通3D虚拟形象,并支持用户的简单编辑操作。面对这个需求,在人脸卡通形象设计时所考虑的关键特征就是基于美学计算的设计知识的基本要素。因此,设计师需要将自己以往的人脸卡通形象设计经验总结为可量化的设计知识,即对不同年龄段、不同性别、不同种族、不同面部特征的人物设计的表现方法进行总结,并注重可量化的表征。在这个项目中,我们把人的五官特征总结了130多个解剖维度。(图5)这些维度能够基本覆盖人物五官的特征,例如在眉眼特征上(图6[7]),将外眼角大于内眼角、高度高于内眼角且眼裂细长的眼型定义为丹凤眼;眼睛长宽比保持在3:2、内外眼角相连成线的眼型定义为杏眼;眼裂高宽、眼白露出较多且瞳仁色深圆润的眼型定义为圆眼,等等。眉毛也遵循三庭五眼比例,以眉头、眉峰、眉尾三点定位,眉峰位置最高,眉尾不能低于眉头等作为基础标准,再根据用户不同长相特征进行细眉(眉宽小于等于眼高的1/3)、长眉(眉长为眼长1.2倍及以上)等具体眉眼型区分。其他脸部特征也依照此设计流程,将抽象形态量化为可计算的数据,如头高(颅顶点至颏下点)与面宽(两颧点间宽)的比例为1.618的是标准椭圆形脸,面宽在头高的1.2倍左右为方形脸等。综上所述,通过总结人脸面部特征的规律,进而排列组合出不同长相的人物,用于卡通风格转化,实现最终自动生成的“千人千面”。按照以上设计知识的总结方法,项目设计了200多个虚拟形象,并在这200多个3D模型中总结出了能够使虚拟人物面部形象特征发生改变的52个关键点。实践证明,这52个关键点在动画应用blendershape中足以支撑虚拟形象设计的五官特征变化,并建立了能够驱动基于用户个人特征的虚拟形象计算算法规则。(图7)
图5.人脸五官特征纬度
图6.女生眼睛形状特征总结
图7.模版匹配生成过程
项目在对卡通虚拟形象的风格特征、五官特征的设计知识和经验梳理的基础之上,总结了130多个特征解剖维度、3D模型中的52个关键点,这些设计知识构建了可计算的基础。在基于美学计算的设计中,设计师对设计理解要更充分,有更多的总结归纳的能力,依靠强大的算法,设计师不再需要一个个地设计、建模、渲染,就可以在几分钟的时间内完成大规模的3D虚拟卡通人物设计,并且与目标用户神似。基于美学计算的设计方法很好地服务了信息时代的大规模生产。
在设计规则提炼方面,运用模版的方式整合所提炼的设计规则是较为常见的方法。在笔者参与的“面向移动终端的广告图像智能生成”项目中,网页广告的设计法则、相关美学原理和设计师的设计经验在被总结、归纳以后,形成了一些设计模版:在设计广告图像的图文排版时,涉及的元素主要有文本、色彩、图像三部分内容,这些元素之间相互配合,形成了不同的版式。(图8)此外,文字的大小、字体、字间距等不同形式特征,以及大量字符形式的文字内容,这些特征都会对排版效果产生影响,在模版规则提炼时都需要考虑在内。本项目主要完成了基于设计规则提炼的文本的布局生成方法,并实现了基于移动终端界面的广告图像布局生成。
图10.视频剪辑系统流程
3
设计面临的机会与挑战
设计活动是一个复杂的过程,对设计研究对象的解读常常包含大量主观的视觉感知特征(如风格、语义等)。在美学计算的过程中,如何将这些特征量化为结构化的数据,从而表达设计对象的特点,是设计师需要研究的重要问题。设计问题主观而抽象,设计求解普遍追求差异化,如何将个性化的设计问题拆解为可量化的数学表达,是人机协同中设计师的重点研究问题。将设计师的研究转化为数据,并将之应用于自动化设计过程中,从而批量化地输出满足需求的结果,这种新的设计模式给设计师提出了新的要求,也向设计研究和计算机技术提出了挑战。
[1] Two Discourses: I. An Essay on the Whole Art of Criticism as It Relates to Painting ... II. An Argument in Behalf of the Science of a Connoisseur ... [M].England: A.C. and sold, 1719.
[2] Hogarth W. The Analysis of Beauty: Written with a View of Fixing the Fluctuating Ideas of Taste[M]. Georg Olms Verlag, 1753.
[3] 高寒、唐降龙、刘家锋等:《基于图像分类的图像美学评价研究》[J],《智能计算机与应用》,2013年第3期,第39-41页。
[4] BirkhoffGD.Aestheticmeasure[M]. Aesthetic Measure. Harvard University Press, 2013.
[5] DengJ,DongW,SocherR,etal.Imagenet:ALarge-scale Hierarchical Image Database[C]. 2009 IEEE Conferenceon Computer Vision and Pattern Recognition. Ieee, 2009: 248-255.
[6] arXiv:2111.12417[cs.CV].https://doi.org/10.48550/arXiv.2111.12417
[7] 引用:眼型自测|眼睛风格[EB/OL].2022.06.02.http://xhslink.com/TegTWj
[8] 华来知识,知识图谱构建流程详解[OL],2021。https://wenku.baidu.com/view/9033a7e288d63186bceb19e8b8f67c1cfbd6ee4f.html
[9] 鲁雨佳、陈实、帅世辉、王禹溪、杨昌源、孙凌云:《基于剪辑元素属性约束的可计算产品展示视频自动剪辑框架》[J],《计算机辅助设计与图形学学报》,2020年第7期,第1101-1110页。
[10] 李玲:《视听语言教程:影视·元素·艺术感》[M],北京:中国传媒大学出版社,2016。
[11] 同[10]。
[12] 杨晓犁:《人工智能背景下的视觉设计方式变革与思考》[J],《美术大观》,2020年第10期,第131-133页。
《装饰》杂志欢迎您的来稿
E-mail:zhuangshi689@263.net
地址:北京市海淀区清华园清华大学美术学院A431 中国装饰杂志社编辑部
电话:010-62798189 010-62798878
邮编:100084
官网:http://www.izhsh.com.cn
建议邮件 书信亦可
在微信中回复“投稿”即可获得投稿须知
投稿1.5月后可致电(010-62798878)查询初审结果
-
阅读原文
* 文章为作者独立观点,不代表数艺网立场转载须知
- 本文内容由数艺网收录采集自微信公众号装饰杂志 ,并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 如您不希望被数艺网所收录,感觉到侵犯到了您的权益,请及时告知数艺网,我们表示诚挚的歉意,并及时处理或删除。