UCSD、MIT等华人团队教机器狗感知3D世界！搭M1芯片，爬楼跨障无所不能｜CVPR 2023-数艺网

资讯: 展览资讯大型展会灯光节大型盛典赛事中标捷报产品快讯热门话题艺术节活动演出新闻数艺报道俱乐部签约

观点: 大咖专访观点洞察书籍推荐吐槽设计观点企业访谈问答趋势创新论文职场方法薪资报价数艺专访

幕后: 幕后故事团队访谈经验分享解密评测数艺访谈

干货: 设计方案策划方案素材资源教程文案资源 PPT下载入门宝典作品合集产品手册电子书项目对接

0
0
0

分享

UCSD、MIT等华人团队教机器狗感知3D世界！搭M1芯片，爬楼跨障无所不能｜CVPR 2023: 2023-05-19

新智元报道

编辑：编辑部

【新智元导读】用苹果M1芯片思考，还能自己遛自己的机器狗，你见过吗？

最近，来自UCSD、IAIFI和MIT机构的研究人员，用一种全新的神经体积记忆架构（NVM），教会了一只机器狗感知三维世界。

利用这项技术，机器狗可以通过单一的神经网络实现爬楼梯、跨缝隙、翻障碍等等——完全自主，无需遥控。

不知道你有没有注意到狗背上那个的白盒子？

里面搭载的是苹果的M1芯片，负责运行机器狗的视觉处理任务。而且，还是团队从一台Mac上拆下来的。

不难看出，MIT的这只机器狗可以轻松地爬过了横在自己面前一段树枝，毫不费力（基本上）。

长了4条腿的MacBook？

众所周知，对于机器狗，以及其他有腿的机器人来说，想要翻越不平整的道路，可谓是困难重重。

路面状况越是复杂，就有越多的障碍无法被看到。

为了解决「部分可观测环境」问题，目前SOTA的视觉-运动技术通过帧堆叠（frame-stacking），将图像通道连接起来。

然而，这种简单的处理方法远远落后于现在的计算机视觉技术——后者可以明确地模拟光流和特定的3D几何形状。

受此启发，团队提出了一种神经体积记忆架构（NVM），可以充分考虑到三维世界的SE(3)等变性（Equivalence）。

项目地址：https://rchalyang.github.io/NVM/

与以往的方法不同，NVM是一种体积格式。它可以将来自多个相机视图的特征体积聚合到机器人的自我中心框架中，从而让机器人能更好地理解周围的环境。

测试的结果显示，使用神经体积记忆（NVM）对腿部运动进行训练后，机器人在复杂的地形上的表现要明显优于之前的技术。

此外，消融实验的结果显示，神经体积记忆中存储的内容捕获了足够的几何信息来重构3D场景。

现实世界中的实验

为了在模拟之外的不同现实世界场景中进行验证，团队在室内和室外场景中都进行了实验。

当机器狗发现有障碍物突然出现在自己面前时，直接就会选择绕开。

在满是石头的地面上，走起来好像也没什么问题，虽然比在平地上还是要费力一些的。

相对于自身来说比较大的障碍，努努力也还是可以翻过去的。

采用此前的识别控制技术，小狗后腿对距离判断明显出现了误差，一脚踩沟里翻车了，失败。

采用MIT提出的NVM之后，小狗过沟，稳稳的幸福，成功！

采用此前的识别控制技术，小狗第一脚就踩空了，狗头抢地，失败。

采用MIT提出的NVM之后，小狗四平八稳地走过了矩阵。

腿部运动的体积记忆

使用以自我为中心的摄像机视角，本质上是一个处理「部分可观测环境」的问题（Partially-Observed）。

为了使控制问题具体化，机器人需要从先前的帧中收集信息，并正确推断被遮挡的地形。

在运动过程中，直接安装在机器人底盘上的摄像机发生剧烈和突然的位置变化。

这样，在表征一连串的画面的过程中，某单个帧能够被放到正确的位置，就变得非常重要了。

为此，团队提出的神经体积记忆（NVM）的概念，可以将输入的一连串视觉信息，转化为场景特征进行3D描绘，进而进行输出。

通过自监督学习NVM

虽然「行为克隆目标」足以产生一个好的策略，但针对平移和旋转的等变性，自动为神经体积记忆提供了一个独立的、自监督的学习目标。

自监督学习：研究团队训练了一个独立的解码器。让它通过一段视觉观察和两个帧之间的预估转换，来预测不同帧中的视觉观察。

如上图所示，可以假设在帧之间周围的3D场景保持不变。由于相机是朝前看的，我们可以将先前帧的特征体积规范化，并用它来预测后续的图像。

解码器的视觉重建

第一幅图显示机器人在环境中移动，第二幅图是输入的视觉观察结果，第三幅图是使用3D特征体积和预估画面合成的视觉观察效果。

对于输入的视觉观察，研究团队对图像应用了大量的数据增强来提高模型的鲁棒性。

作者介绍

Ruihan Yan

Ruihan Yan是加州大学圣地亚哥分校的二年级博士生。在此之前，他于2019年在南开大学获得软件工程学士学位

他的研究兴趣是强化学习、机器学习、机器人等。具体来说，他想建立智能体，利用来自不同来源的信息进行决策。

Ge Yang

Ge Yang本科毕业于耶鲁大学物理和数学专业，并在芝加哥大学获得物理学博士学位。目前是美国国家科学基金会人工智能与基础交互作用研究所（IAIFI）的博士后研究员。

Ge Yang的研究涉及两组相关问题。第一组是通过重新审视我们在神经网络中表征知识的方式，以及知识如何在分布中转移，来改善学习。第二组是通过理论工具的视角来看待强化学习，如神经正切核、非欧几里得几何和哈密顿动力学。

Xiaolong Wang

Xiaolong Wang是加州大学圣地亚哥分校ECE系的一名助理教授。他是TILOS国家科学基金会人工智能研究所的机器人团队的成员。

他在卡内基梅隆大学获得了机器人学的博士学位，并曾在加州大学伯克利分校做博士后研究。

参考资料：

https://rchalyang.github.io/NVM/

阅读原文 * 文章为作者独立观点，不代表数艺网立场转载须知: 本文内容由数艺网收录采集自微信公众号新智元 ，并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源：数艺网” 并附上本页链接：如您不希望被数艺网所收录，感觉到侵犯到了您的权益，请及时告知数艺网，我们表示诚挚的歉意，并及时处理或删除。

数字媒体艺术新媒体艺术科技艺术

11328

0

评论 (0)

登录| 注册后参与评论

北京

甲方 · 媒体平台

未认证的机构号

+关注认领

recently released

查看更多

Related articles

您确定认领此案例

数艺网是一个信息获取、分享及传播的平台，我们尊重和鼓励数艺网用户创作的内容，认识到保护知识产权对数艺网生存与发展的重要性，承诺将保护知识产权作为数艺网运营的基本原则之一。

本条款原则如下：

1. 用户在数艺网上发表的全部原创内容（包括但不仅限于文章、案例/项目和评论），著作权均归用户本人所有。用户可授权第三方以任何方式使用，不需要得到数艺网的同意。

2. 数艺网上可由多人参与编辑的内容，包括但不限于案例/作品的认领、企业/机构的认领，所有参与编辑者均同意，相关知识产权归数艺网所有。

3. 数艺网提供的网络服务中包含的标识、版面设计、排版方式、文本、图片、图形等均受著作权、商标权及其它法律保护，未经相关权利人（含数艺网及其他原始权利人）同意，上述内容均不得在任何平台被直接或间接发布、使用、出于发布或使用目的的改写或再发行，或被用于其他任何商业目的。

4. 为了促进知识的分享和传播，用户将其在数艺网上发表的全部内容，授予数艺网免费的、不可撤销的、非独家使用许可，数艺网有权将该内容用于数艺网各种形态的产品和服务上，包括但不限于网站以及发表的应用或其他互联网产品。

5. 第三方若出于非商业目的，将用户在数艺网上发表的内容转载在数艺网之外的地方，应当在作品的正文开头的显著位置注明原作者姓名（或原作者在数艺网上使用的帐号名称），给出原始链接，注明「发表于数艺网」，并不得对作品进行修改演绎。若需要对作品进行修改，或用于商业目的，第三方应当联系用户获得单独授权，按照用户规定的方式使用该内容。

6. 数艺网为用户提供「保留所有权利，禁止转载」的选项。除非获得原作者的单独授权，任何第三方不得转载标注了「禁止转载」的内容，否则均视为侵权。

7. 在数艺网上传或发表的内容，用户应保证其为著作权人或已取得合法授权，并且该内容不会侵犯任何第三方的合法权益。如果第三方提出关于著作权的异议，数艺网有权根据实际情况删除相关的内容，且有权追究用户的法律责任。给数艺网或任何第三方造成损失的，用户应负责全额赔偿。

8. 如果任何第三方侵犯了数艺网用户相关的权利，用户同意授权数艺网或其指定的代理人代表数艺网自身或用户对该第三方提出警告、投诉、发起行政执法、诉讼、进行上诉，或谈判和解，并且用户同意在数艺网认为必要的情况下参与共同维权。

9. 数艺网有权但无义务对用户发布的内容进行审核，有权根据相关证据结合《侵权责任法》、《信息网络传播权保护条例》等法律法规及数艺网社区管理规定对侵权信息进行处理。

侵权举报

1.处理原则

数艺网作为新媒体艺术领域的分享交流平台，高度重视自由表达和个人、机构正当权利的平衡。依照法律规定删除违法信息是数艺网社区的法定义务，数艺网社区亦未与任何中介机构合作开展此项业务。

2.受理范围

受理数艺网社区内侵犯机构或个人合法权益的侵权举报，包括但不限于涉及个人隐私、造谣与诽谤、商业侵权。

a.涉及个人隐私：发布内容中直接涉及身份信息，如个人姓名、家庭住址、身份证号码、工作单位、私人电话等详细个人隐私；

b.造谣、诽谤：发布内容中指名道姓（包括自然人和机构）的直接谩骂、侮辱、虚构中伤、恶意诽谤等；

c.商业侵权：泄露机构商业机密及其他根据保密协议不能公开讨论的内容。

3.举报条件

用户在数艺网发表的内容仅表明其个人的立场和观点，并不代表数艺网的立场或观点。如果个人或机构发现数艺网上存在侵犯自身合法权益的内容，可以先尝试与作者取得联系，通过沟通协商解决问题。如您无法联系到作者，或无法通过与作者沟通解决问题，您可通过点击内容下方的举报按钮来向数艺网平台进行投诉。为了保证问题能够及时有效地处理，请务必提交真实有效、完整清晰的材料，否则投诉将无法受理。您需要向数艺网提供的投诉材料包括：

a. 权利人对涉嫌侵权内容拥有商标权、著作权和/或其他依法可以行使权利的权属证明，权属证明通常是营业执照或组织机构代码证；

b. 完整填写的通知书；附供下载的：侵权投诉通知书；

c. 举报人的身份证明，身份证明可以是身份证或护照；

d. 如果举报人非权利人，请举报人提供代表权利人进行举报的书面授权证明。

e. 为确保投诉材料的真实性，在侵权举报中，您还需要签署以下法律声明：

(1) 我本人为所举报内容的合法权利人；

(2) 我举报的发布在数艺网社区中的内容侵犯了本人相应的合法权益；

(3) 如果本侵权举报内容不完全属实，本人将承担由此产生的一切法律责任，并承担和赔偿数艺网因根据投诉人的通知书对相关帐号的处理而造成的任何损失，包括但不限于知乎因向被投诉方赔偿而产生的损失及数艺网名誉、商誉损害等。

4.处理流程

出于网络平台的监督属性，并非所有申请都必须受理。数艺网自收到举报的七个工作日内处理完毕并给出回复。处理期间，不提供任何电话、邮件及其他方式的查询服务。出现数艺网已经删除或处理的内容，但是百度、谷歌等搜索引擎依然可以搜索到的现象，是因为百度、谷歌等搜索引擎自带缓存，此类问题数艺网无权也无法处理，因此相关申请不予受理。您可以自行联系搜索引擎服务商进行处理。此为数艺网社区唯一的官方侵权投诉渠道，暂不提供其他方式处理此业务。用户在数艺网中的商业行为引发的法律纠纷，由交易双方自行处理，与数艺网无关。

免责申明

1.数艺网不能对用户发表的回答或评论的正确性进行保证。

2.用户在数艺网发表的内容仅表明其个人的立场和观点，并不代表数艺网的立场或观点。作为内容的发表者，需自行对所发表内容负责，因所发表内容引发的一切纠纷，由该内容的发表者承担全部法律及连带责任。数艺网不承担任何法律及连带责任。

3.数艺网不保证网络服务一定能满足用户的要求，也不保证网络服务不会中断，对网络服务的及时性、安全性、准确性也都不作保证。

4.对于因不可抗力或数艺网不能控制的原因造成的网络服务中断或其它缺陷，数艺网不承担任何责任，但将尽力减少因此而给用户造成的损失和影响。

协议修改

1.根据互联网的发展和有关法律、法规及规范性文件的变化，或者因业务发展需要，数艺网有权对本协议的条款作出修改或变更，一旦本协议的内容发生变动，数艺网将会直接在数艺网网站上公布修改之后的协议内容，该公布行为视为数艺网已经通知用户修改内容。数艺网也可采用电子邮件或私信的传送方式，提示用户协议条款的修改、服务变更、或其它重要事项。

2.如果不同意数艺网对本协议相关条款所做的修改，用户有权并应当停止使用数艺网。如果用户继续使用数艺网，则视为用户接受数艺网对本协议相关条款所做的修改。

阅读并同意此认领协议方可认领案例