
—— 青亭网

分享
原创 2022-04-07
Esther|编辑
去年青亭网曾报道,宝马利用Omniverse平台的虚拟仿真引擎Isaac Sim,将线下工厂进行复制,并在虚拟场景中训练机器人的导航算法。据了解,通常训练机器感知系统需要大量有标签的数据,然而手动标记数据的成本高、费时而且可能存在误差。因此,人们开始思考如何去合成这种训练数据,也就是在计算机中进行训练,然后将训练结果应用于真实的机器人系统中。
与真实训练方案相比,在计算机合成的虚拟场景中训练机器人有多种好处,比如不受时间、地理位置限制,而且低成本、自动化等等。
不仅如此,MIT、哈佛、斯坦福和IBM组成的科研团队现有的仿真技术基础上,还开发了一种更加灵活、合成内容更丰富的虚拟场景合成系统:ThreeDWorld。该系统不仅能合成虚拟空间的视觉效果,还能模拟高度物理交互以及空间中的动态音效。
科研人员表示:TDW这是一个基于Unity的多模式、交互式物理模拟平台,其特点是可以在各种3D场景中模拟高保真的感知数据和物理交互,而场景中的参数支持完整设置和访问。
目标是模拟现实中任何交互
创建逼真的虚拟世界来研究人类行为和训练机器人一直是人工智能和认知科学研究人员的梦想。现在大多数人工智能都是基于监督学习,它依赖于人类注释图像或声音的巨大数据集,数据集的成本很高,给研究造成了瓶颈。而且物体的质量等特性难以标记。为了解决这一问题,TDW中所有的参数和标记都是合成的,也就是已知的。
TDW论文的主要作者、麻省理工学院-IBM 沃森人工智能实验室研究科学家Chuang Gan表示:团队成员都对建立一个虚拟世界的想法很感兴趣,目的是训练接近大脑模型的人工智能系统,我们认为这种虚拟环境可以让物体相互交互,然后从中呈现真实的感官数据,这将是开始研究它的一种有价值的方式。
我们的目标是建设一个通用的模拟平台,以模拟现实世界中丰富的交互,可用于各种应用场景、培训多样化的AI程序。也就是说比其他3D物理模拟平台更加通用、灵活,支持更广泛的应用场景,比如模拟3D室内设计、3D导航、3D实验、3D目标检测、3D物理预测、推测婴儿行为、任务与运动预测。
经过测试表明,将音频和视觉结合在一起是识别物体物理特性的最佳方式,因此科研人员决定在视觉模拟基础上,加入音效模拟。
灵活的应用场景
在TDW系统中,可以采用虚拟代理来代替机器人等感知系统,这些代理就像是虚拟空间的居民,可以与周围的场景互动。具体来讲,它有以下几种功能:
1)生成用于训练AI网络的大量合成图像数据:
可将椅子、狗、苹果、大象等有标记的3D模型加载到虚拟场景中,场景的观察角度、位置参数、阳光角度、视觉材料等参数是随机的。
2)模拟交互效果:
通过学习动力、几何结构对于碰撞效果的影响,AI可通过TDW平台来模拟虚拟物体之间的交互。
3)培训具象化的AI:
这个应用的目的是训练AI与虚拟环境互动,甚至改变虚拟环境的状态。可用来培训AI规划任务和运动路线,在虚拟空间导航以及获取目标对象。
类似方案对比
多模式渲染
与市面现有的模拟框架相比,TDW可以同时发送多个指令,因此可模拟任意的复杂行为。TDW不仅可以在笔记本电脑端本地运行,也可以在远程服务器、Docker容器中运行。
其渲染效果有两大特点:
1)照片级、写实的图像观感
可模拟高保真的照明和渲染效果,3D场景和对象模型数据的质量也足够高。100%实时全局照明,无光照贴图烘焙。TDW的光照模型采用单一的主要光源,代表太阳光。3D模型和场景中的光照和阴影可根据光源的角度来动态调节。
通用的场景照明则采用HDR图像,或HDRI天空盒(skybox),类似于高保真的场景投影(包含一天中任意时刻,特定场景的光照条件)。此外,室内和室外场景均可渲染,其中一些场景是通过摄影测量法扫描而成。
场景中的3D模型来自于高质量数据库,尺寸是标准化的,符合真实比例,而且配备语义注释、元数据。而且这些模型为实时3D渲染进行了优化,采用PDR材质,可对光线变化产生反馈,模拟自然的物理效果。此外,也可以模拟在物理交互时产生的声音变化(比如撞击声)。
2)高保真的声学渲染(PyImpact)
基于Unity内置音频和Resonance Audio的3D空间化功能,可通过头部数据相关的传递函数,来实时渲染高质量的回响、定向声音等模拟音效。
换句话说,就是可以模拟空间音频,合成的声音会因距离而衰减,而且也可以被物体或环境结构遮挡。回声模型会根据空间几何形状而变化,受到多种因素影响,比如:虚拟场景中墙壁、地板、天花板的材质,以及虚拟空间的体积、空间内固体物品(如家具)的占比等等。
一大亮点是TDW基于物理的冲击声合成功能,可根据碰撞物体的重量、材料,以及撞击速度和角度等参数来动态渲染。可模拟模板纸箱、金属碗、陶瓷、塑料纸板、石头等14种材料撞击时的脉冲回响,也就是不同材料撞击时产生的特有声响。
经试验证实,体验者们难以区分合成的音效和真实音效,而且可以根据合成音效来判断模拟的物理性质。
效果展示
为了展示TDW多模式渲染效果,科研人员开发了一项挑战,即在多模式虚拟场景中训练AI代理。AI代理的任务是,根据声音和视觉,来寻找掉落在房间某处的物体。目标物体可能在沙发后面、柜子顶上、容器内部或被其他物体遮挡,因此AI代理需要判断是否移开一些物品来获取目标。
此外,科研人员还测试了TDW的其他一些模拟效果:
1)模拟物品之间的交互
为了模拟逼真的物理交互,TDW包含了两个不同的物理引擎:Unity基本的物理引擎PhysX+V-HACD创建网格、NVIDIA Flex+用粒子表示底层模型变形和交互。这两个引擎可实现高端的物理模拟,一个用于模拟硬性物体,一个用来模拟柔软物体和流体,比如布料、流体等材质的物理特性。
机器学习模型可通过TDW模拟交互而产生的物理效果和合成图像,来学习世界的物理和视觉表现,从而模仿人类对于物理学的直觉。比如区分物体是在滑动还是滚动、柔性材质碰到不同物体时不同的物理表现、流体的物理变化特性,或是在目标物体离开AI模型的观测区域时持续预测运动。
2)AI代理与物体交互
在这个演示中,动作和交互完全由物理驱动,没有预设动画。科研人员创造了36个可交互的3D室内设计场景,通过为AI代理提供空间占用地图(显示没有障碍物的空区),来帮助训练AI在空间中导航。
科研人员还开发了一个demo,挑战在模拟的住宅场景中随机生成AI代理,并命令AI收集散落在住宅内的一些物品,并送到指定的地点。AI代理需要在有限数量的动作内完成挑战,也可以使用住宅中的容器来提升物体运输的效率。
还可以训练人形的AI代理,号称合成的身体运动像实时动捕那样逼真,而且可模拟拼图等精细的动作。训练数据还可能导入到现实的机械臂中。
3)人与物体交互
这是一个由AI驱动的虚拟世界合成系统,可模拟丰富的交互式视听场景,可用于人类培训、机器人算法训练、实验研究等场景。一些在日常生活中出现的场景或动作,在这个逼真的世界中也可以模拟。
人可以和TDW合成的VR场景直接交互,目前TDW支持Oculus Rift S头显,未来还将支持Quest 2,以及Quest 2的手势追踪功能。
( END)
* 文章为作者独立观点,不代表数艺网立场转载须知
广告 欺诈 淫秽 色情 侵权 骚扰、辱骂、歧视 敏感 违法 犯罪 反动、政治 其它
数艺网是一个信息获取、分享及传播的平台,我们尊重和鼓励数艺网用户创作的内容,认识到保护知识产权对数艺网生存与发展的重要性,承诺将保护知识产权作为数艺网运营的基本原则之一。
本条款原则如下:
1. 用户在数艺网上发表的全部原创内容(包括但不仅限于文章、案例/项目和评论),著作权均归用户本人所有。用户可授权第三方以任何方式使用,不需要得到数艺网的同意。
2. 数艺网上可由多人参与编辑的内容,包括但不限于案例/作品的认领、企业/机构的认领,所有参与编辑者均同意,相关知识产权归数艺网所有。
3. 数艺网提供的网络服务中包含的标识、版面设计、排版方式、文本、图片、图形等均受著作权、商标权及其它法律保护,未经相关权利人(含数艺网及其他原始权利人)同意,上述内容均不得在任何平台被直接或间接发布、使用、出于发布或使用目的的改写或再发行,或被用于其他任何商业目的。
4. 为了促进知识的分享和传播,用户将其在数艺网上发表的全部内容,授予数艺网免费的、不可撤销的、非独家使用许可,数艺网有权将该内容用于数艺网各种形态的产品和服务上,包括但不限于网站以及发表的应用或其他互联网产品。
5. 第三方若出于非商业目的,将用户在数艺网上发表的内容转载在数艺网之外的地方,应当在作品的正文开头的显著位置注明原作者姓名(或原作者在数艺网上使用的帐号名称),给出原始链接,注明「发表于数艺网」,并不得对作品进行修改演绎。若需要对作品进行修改,或用于商业目的,第三方应当联系用户获得单独授权,按照用户规定的方式使用该内容。
6. 数艺网为用户提供「保留所有权利,禁止转载」的选项。除非获得原作者的单独授权,任何第三方不得转载标注了「禁止转载」的内容,否则均视为侵权。
7. 在数艺网上传或发表的内容,用户应保证其为著作权人或已取得合法授权,并且该内容不会侵犯任何第三方的合法权益。如果第三方提出关于著作权的异议,数艺网有权根据实际情况删除相关的内容,且有权追究用户的法律责任。给数艺网或任何第三方造成损失的,用户应负责全额赔偿。
8. 如果任何第三方侵犯了数艺网用户相关的权利,用户同意授权数艺网或其指定的代理人代表数艺网自身或用户对该第三方提出警告、投诉、发起行政执法、诉讼、进行上诉,或谈判和解,并且用户同意在数艺网认为必要的情况下参与共同维权。
9. 数艺网有权但无义务对用户发布的内容进行审核,有权根据相关证据结合《侵权责任法》、《信息网络传播权保护条例》等法律法规及数艺网社区管理规定对侵权信息进行处理。
侵权举报
1.处理原则
数艺网作为新媒体艺术领域的分享交流平台,高度重视自由表达和个人、机构正当权利的平衡。依照法律规定删除违法信息是数艺网社区的法定义务,数艺网社区亦未与任何中介机构合作开展此项业务。
2.受理范围
受理数艺网社区内侵犯机构或个人合法权益的侵权举报,包括但不限于涉及个人隐私、造谣与诽谤、商业侵权。
a.涉及个人隐私:发布内容中直接涉及身份信息,如个人姓名、家庭住址、身份证号码、工作单位、私人电话等详细个人隐私;
b.造谣、诽谤:发布内容中指名道姓(包括自然人和机构)的直接谩骂、侮辱、虚构中伤、恶意诽谤等;
c.商业侵权:泄露机构商业机密及其他根据保密协议不能公开讨论的内容。
3.举报条件
用户在数艺网发表的内容仅表明其个人的立场和观点,并不代表数艺网的立场或观点。如果个人或机构发现数艺网上存在侵犯自身合法权益的内容,可以先尝试与作者取得联系,通过沟通协商解决问题。如您无法联系到作者,或无法通过与作者沟通解决问题,您可通过点击内容下方的举报按钮来向数艺网平台进行投诉。为了保证问题能够及时有效地处理,请务必提交真实有效、完整清晰的材料,否则投诉将无法受理。您需要向数艺网提供的投诉材料包括:
a. 权利人对涉嫌侵权内容拥有商标权、著作权和/或其他依法可以行使权利的权属证明,权属证明通常是营业执照或组织机构代码证;
b. 完整填写的通知书;附供下载的:侵权投诉通知书;
c. 举报人的身份证明,身份证明可以是身份证或护照;
d. 如果举报人非权利人,请举报人提供代表权利人进行举报的书面授权证明。
e. 为确保投诉材料的真实性,在侵权举报中,您还需要签署以下法律声明:
(1) 我本人为所举报内容的合法权利人;
(2) 我举报的发布在数艺网社区中的内容侵犯了本人相应的合法权益;
(3) 如果本侵权举报内容不完全属实,本人将承担由此产生的一切法律责任,并承担和赔偿数艺网因根据投诉人的通知书对相关帐号的处理而造成的任何损失,包括但不限于知乎因向被投诉方赔偿而产生的损失及数艺网名誉、商誉损害等。
4.处理流程
出于网络平台的监督属性,并非所有申请都必须受理。数艺网自收到举报的七个工作日内处理完毕并给出回复。处理期间,不提供任何电话、邮件及其他方式的查询服务。 出现数艺网已经删除或处理的内容,但是百度、谷歌等搜索引擎依然可以搜索到的现象,是因为百度、谷歌等搜索引擎自带缓存,此类问题数艺网无权也无法处理,因此相关申请不予受理。您可以自行联系搜索引擎服务商进行处理。 此为数艺网社区唯一的官方侵权投诉渠道,暂不提供其他方式处理此业务。 用户在数艺网中的商业行为引发的法律纠纷,由交易双方自行处理,与数艺网无关。
免责申明
1.数艺网不能对用户发表的回答或评论的正确性进行保证。
2.用户在数艺网发表的内容仅表明其个人的立场和观点,并不代表数艺网的立场或观点。作为内容的发表者,需自行对所发表内容负责,因所发表内容引发的一切纠纷,由该内容的发表者承担全部法律及连带责任。数艺网不承担任何法律及连带责任。
3.数艺网不保证网络服务一定能满足用户的要求,也不保证网络服务不会中断,对网络服务的及时性、安全性、准确性也都不作保证。
4.对于因不可抗力或数艺网不能控制的原因造成的网络服务中断或其它缺陷,数艺网不承担任何责任,但将尽力减少因此而给用户造成的损失和影响。
协议修改
1.根据互联网的发展和有关法律、法规及规范性文件的变化,或者因业务发展需要,数艺网有权对本协议的条款作出修改或变更,一旦本协议的内容发生变动,数艺网将会直接在数艺网网站上公布修改之后的协议内容,该公布行为视为数艺网已经通知用户修改内容。数艺网也可采用电子邮件或私信的传送方式,提示用户协议条款的修改、服务变更、或其它重要事项。
2.如果不同意数艺网对本协议相关条款所做的修改,用户有权并应当停止使用数艺网。如果用户继续使用数艺网,则视为用户接受数艺网对本协议相关条款所做的修改。
阅读并同意此认领协议方可认领案例
*认领案例的操作记录无法自行删除,请务必确保您参与该案例身份的真实性