
—— 青亭网

分享
2023-05-25
Esther | 编辑
苹果MR头显可以说是板上钉钉了,看了这么多的预测,几乎没有从ARKit的角度来看苹果头显的,因此本文我们将回顾ARKit近7年来的发展历程。
实际上,ARKit 3.5开始支持LiDAR(首个搭载的设备是iPad Pro 2020)就是为AR/VR头显筹备的重要一步,因为LiDAR可以实现更快距离探测实现即时AR交互,虚拟物体定位更精准,也带来了比如更逼真的遮挡效果提升沉浸感,还有更好的场景几何理解能力,为结合现实环境的MR交互提供基础。同时还有更重要的多物体AR交互能力,可以实现复杂AR场景。这些让苹果的AR体验实现了房间级的AR交互(实际上,这个概念至今没有多少媒体引用)。相关阅读:《iPad Pro新使命:开启房间级AR体验,iPhone、AR头显紧随其后》。
去年发布的ARKit 6基本就印证了苹果VST设备的策略,比如:支持4K分辨率显示、支持相机曝光调节、支持HDR录制等。以相机曝光调节为例,结合“数码旋钮”可以实现在VR和AR无缝切换能力,这个功能也是近半年被爆出苹果MR的一个重磅功能。其它功能也基本围绕“视频透视”的能力展开,非常容易联想到VST模式。相关阅读:《WWDC22:ARKit 6低调发布,新功能瞄准VST MR头显》。
虽然说ARKit在iPhone和iPad并没有激起波澜,但将在苹果AR/MR头显上发挥重要作用。而且因苹果具备极强的软硬件整合能力,这些AR能力至今都是业内一流。
从2017年开始,苹果每年都会在WWDC活动上发布新版ARKit,截止去年已经更新迭代至ARKit 6,今年WWDC不出意外苹果MR头显即将发布。那么在此之前,也许我们可以通过ARKit的技术演变,来看看苹果的AR/VR策略,甚至猜猜未来哪些可能会体现在头显硬件上。
ARKit重要功能一览
第一个版本的ARKit支持的功能不多,但在当时是开创性的,它用法简单、性能优秀,允许开发者iPhone、iPad打造AR应用。ARKit 1使用视觉惯性里程计(VIO,一种融合相机和IMU数据实现SLAM的算法)来追踪周围物理场景,无需额外校准,就能可靠提取基于初始点的位置和方向变化。
此外还支持光照估计和渲染(由来优化AR外观),以及场景理解功能,比如检测水平面,并使用iPhone X的前置摄像头追踪人脸。通过ARKit 1,开发者可以将虚拟家具放置在真实场景中,或是允许用户在餐厅中踢AR足球。而面部追踪功能,则让Snapchat等AR滤镜更容易实现。
ARKit 1在A9和A10处理器上运行,支持Metal、SceneKit、Unity、Unreal等3D渲染引擎。
此前,ARKit 1只能识别桌面、椅子等水平表面,而ARKit 1.5则加入对墙体、房门等垂直表面的识别支持,允许开发者在垂直表面上固定AR内容。此外借助计算机视觉技术,对圆形家具等不规则表面的检测效果更准确,也能识别空间内的标志、海报、插图、二维码等2D图像,并调出对应的AR内容。
本次更新还改进了AR整体的质量,比如图像分辨率提升50%,支持自动对焦,更准确的房间测绘,让AR内容看起来更真实。
在WWDC 2018上,推出ARKit 2,还推出了一个与皮克斯合作开发的AR格式:USDZ,以及AR快速预览功能(AR Quick Look)。
ARKit 2性能升级部分:1,改进的人脸追踪效果;2,更逼真的渲染处理能力;3,3D控件检测能力;4,对象持久保持的能力;5,可共享的多人AR能力(基于本地设备到设备的数据传输,非云端。现场演示了乐高多人AR游戏)。
据了解,皮克斯此前曾开发可扩展的开源3D说明文件格式:USD,而USDZ则是针对AR的文件格式,特点是采用嵌入式设计,可快速预,目的是为了简化AR文件的访问和共享流程,而通过嵌入到app或网页中,可以很好的打通苹果全家桶生态。
苹果还推出了AR测量app《Measure》,可使用相机视觉预测物体尺寸、体积等数据,比如相框中相片的大小。
在WWDC 2019上,苹果不仅推出ARKit 3,还发布两个新的AR开发工具:RealityKit和Reality Composer,目的是补充ARKit,简化3D场景创建,提高AR交互场景的开发速度和效率。
ARKit 3更新包括:同时使用前置和后置相机来定位、动作捕捉、人体遮挡、更快的参考图像载入、自动识别图像尺寸、视觉连贯性、更稳定的3D物体识别、多人面部追踪、多人实时协作、识别高达100张图像、HDR环境纹理、AR Coaching UI,以及AR快速预览支持更多机型,并支持录制视频、启动Apple Pay、空间音频等功能。
RealityKit可以在真实场景中以AR形式展示3D控件,从而快速实现AR场景融合。该工具主要有5大亮点:1,照片级渲染效果;2,支持环境和相机特效;3,支持动画、物理、音频等特效;4,整合ARKit;5,原生支持Swift API。
而Reality Composer则是一个3D场景创建工具,特点是通过拖拽、点击等简单操作,即可生成交互式AR场景。该工具内置大量3D内容数据库,还可与Xcode和iOS应用配合使用,从而实现AR场景快速预览、微调,大幅提升效率。
随着搭载LiDAR传感器的iPad Pro在2020年发售,苹果也推出了ARKit 3.5,其中包含了多个功能:场景几何(Scene Geometry)API、即时AR体验,此外还改进了动作捕捉和人体遮挡功能。这些功能和特性基于LiDAR硬件来实现,因此仅支持搭载LiDAR的iPad或iPhone型号。
场景几何API:可实时捕捉场景中的3D物体(地板、墙壁、天花板、窗户、门、桌椅),并构建3D场景模型,提升整个场景的3D识别能力。
即时AR体验:在开启AR模式时,无需左右扫描场景即可快速、实时放置AR对象。
从ARKit 3.5开始,ARKit的新功能主要围绕LiDAR等硬件技术展开,在此基础上,ARKit 4小幅更新,主要带来以下功能:深度API、位置锚定、AR视频纹理,同时面部追踪支持更多设备。
深度API:通过LiDAR对每个像素的深度信息进行分析,并与场景几何的3D网格数据结合使用,让虚拟物体与现实物体的融合更逼真、自然。同时,还可进一步提升AR测距应用的准确性;
位置锚定:基于Apple Maps数据,可将高分辨率AR内容(LBS AR)持续固定在现实场景/位置,例如一个著名景区,通过位置锚定即可为AR虚拟物体加上经纬度、海拔等信息,从而与地理位置永久性的融合。
此前,ARKit 2已经支持持久性AR,与位置锚定不同的是,持久性AR基于保存与加载地图特性,利用了视觉定位,而没有结合地图GPS数据。
视频纹理:可将视频纹理添加到RealityKit场景中任意部分,让物理对象、表面、人物看起来更生动。
面部追踪扩展:支持使用A12 Bionic及更新芯片的设备,但在特定的设备上,面部识别功能依然受限,比如iPhone SE仅支持单用户追踪,而具备原深感相机TureDepth的设备可同时识别追踪三个人脸信息。
在WWDC 2021期间,苹果低调更新了ARKit 5,同时也推出了RealityKit 2。
ARKit 5新功能主要有四点:1,位置锚定支持更多地区;2,人脸追踪功能升级(支持更多A12芯片设备,在配备深感相机设备中,支持3人面部追踪);3,改进运动追踪;4,AR绑定App Clip Code二维码。
而RealityKit 2新功能则包括:1,3D扫描(Object Capture API);2,自定义着色器;3,动态加载方式;4,系统模块定制;5,虚拟角色控制器。
Object Capture API是RealityKit 2的一大亮点,该功能旨在统一、简化3D扫描和建模的流程,同时更加充分利用LiDAR能力。据称,该API可在几分钟内输出USDZ格式的高质量3D模型,支持AR快速预览,也可以导入Reality Composer等其他工具。
在WWDC 2022期间,苹果依旧低调更新ARKit 6,本次更新的重磅功能包括:4K分辨率,HDR录制,实时调节相机曝光、白平衡等参数,这些功能对VST透视AR体验相当重要,未来能否应用于苹果MR头显则令人期待。此外,还加入了前摄+后摄融合玩法,可通过前摄捕捉人脸,然后基于后摄拍摄背景,实现一些另类的玩法和交互。
现有的功能也得到优化:改进了运动追踪,现支持识别左右耳朵,优化了姿态检测功能,可以自动估算好拍摄场景中物体的大小,并实现稳定的追踪效果,提高3D物体检测的鲁棒性。
ARKit 6依然只是小幅更新,一方面是因为该技术本身已经领先竞争对手,另一方面,按照苹果的设计思路,软件方面新功能大概率需更强大的硬件做支撑。
4K分辨率、HDR录制可为视频拍摄和分享、电影制作等场景带来价值,与此同时,也可以实现更好的VST混合现实效果。以往在谈到移动AR时,更多关注的是3D AR内容的清晰度、逼真度,以及与物理场景的自然交互/融合。而实际上,移动ARden视频背景清晰度也同样重要,对于VST头显来讲更是如此,清晰的视频透视可减少长时间体验的视觉疲劳。此外,ARKit 6带来的实时调节相机曝光、白平衡、对焦功能,对于沉浸式AR体验也很重要,比如可以把现实场景调暗等等操作。
甚至,如果还可以设置不同的焦点切换(这一点暂时没有明确),还能基于此实现引导注意力转移等玩法,对MR游戏的虚实融合类交互帮助很大,想象空间很大。
苹果还发布了新的AR工具:RoomPlan API,特点是基于ARKit和Swift API,硬件基于LiDAR设备,可通过扫描房屋场景进行3D规划,适用于房地产、建筑、室内设计、电子商务、酒店管理等行业。扫描后可导出USD或USDZ格式文件,文件中信息包括:房间中识别到的组件尺寸,家具类型等,并可在C4D、AutoCAD、Shapr3D等进一步编辑。
至此,苹果AR生态由5大套件组成:ARKit、RealityKit、RoomPlan、AR创作工具(Reality Composer、Reality Converter、Xcode和USDZ工具)和AR Quick Look。
在LBS AR、VPS领域,苹果也有布局,但全新设计的苹果地图在全球覆盖率上不如谷歌地图。比如此前苹果曾推出类似谷歌街景的Look Around功能,可实现基于VPS原理的AR导航等功能,但AR导航仅支持十几个城市。
此外,苹果在WWDC 2022上还推出了MapKit,允许开发者在AR应用中调用原生地图能力,推动LBS AR应用。
从ARKit的一次次更新中,一个重点是打通3D内容格式(USDZ),另一方面则是利用LiDAR模组优化AR性能。如无意外,苹果未来的AR/VR头显也将支持大量的LiDAR功能和应用。比如可以预见的是,图像识别、文字语言翻译、单位转换、价格识别等基于摄像头的玩法,未来很可能会作为MR/AR头戴设备的基础功能。
由此可见,ARKit打磨6-7年时间,苹果借助现有硬件已经支持相机动态调焦,以及曝光、白平衡等参数调节。而且,在相机、视频录制上有明显优势,显然苹果的VST方案上限可能会很高,就像是早年间的安卓手机和iPhone拍照的差别。接下来,苹果要做的就是AR/VR头显端的内容生态,这也直接影响着用户对这款产品的关注程度。
( END)
* 文章为作者独立观点,不代表数艺网立场转载须知
广告 欺诈 淫秽 色情 侵权 骚扰、辱骂、歧视 敏感 违法 犯罪 反动、政治 其它
数艺网是一个信息获取、分享及传播的平台,我们尊重和鼓励数艺网用户创作的内容,认识到保护知识产权对数艺网生存与发展的重要性,承诺将保护知识产权作为数艺网运营的基本原则之一。
本条款原则如下:
1. 用户在数艺网上发表的全部原创内容(包括但不仅限于文章、案例/项目和评论),著作权均归用户本人所有。用户可授权第三方以任何方式使用,不需要得到数艺网的同意。
2. 数艺网上可由多人参与编辑的内容,包括但不限于案例/作品的认领、企业/机构的认领,所有参与编辑者均同意,相关知识产权归数艺网所有。
3. 数艺网提供的网络服务中包含的标识、版面设计、排版方式、文本、图片、图形等均受著作权、商标权及其它法律保护,未经相关权利人(含数艺网及其他原始权利人)同意,上述内容均不得在任何平台被直接或间接发布、使用、出于发布或使用目的的改写或再发行,或被用于其他任何商业目的。
4. 为了促进知识的分享和传播,用户将其在数艺网上发表的全部内容,授予数艺网免费的、不可撤销的、非独家使用许可,数艺网有权将该内容用于数艺网各种形态的产品和服务上,包括但不限于网站以及发表的应用或其他互联网产品。
5. 第三方若出于非商业目的,将用户在数艺网上发表的内容转载在数艺网之外的地方,应当在作品的正文开头的显著位置注明原作者姓名(或原作者在数艺网上使用的帐号名称),给出原始链接,注明「发表于数艺网」,并不得对作品进行修改演绎。若需要对作品进行修改,或用于商业目的,第三方应当联系用户获得单独授权,按照用户规定的方式使用该内容。
6. 数艺网为用户提供「保留所有权利,禁止转载」的选项。除非获得原作者的单独授权,任何第三方不得转载标注了「禁止转载」的内容,否则均视为侵权。
7. 在数艺网上传或发表的内容,用户应保证其为著作权人或已取得合法授权,并且该内容不会侵犯任何第三方的合法权益。如果第三方提出关于著作权的异议,数艺网有权根据实际情况删除相关的内容,且有权追究用户的法律责任。给数艺网或任何第三方造成损失的,用户应负责全额赔偿。
8. 如果任何第三方侵犯了数艺网用户相关的权利,用户同意授权数艺网或其指定的代理人代表数艺网自身或用户对该第三方提出警告、投诉、发起行政执法、诉讼、进行上诉,或谈判和解,并且用户同意在数艺网认为必要的情况下参与共同维权。
9. 数艺网有权但无义务对用户发布的内容进行审核,有权根据相关证据结合《侵权责任法》、《信息网络传播权保护条例》等法律法规及数艺网社区管理规定对侵权信息进行处理。
侵权举报
1.处理原则
数艺网作为新媒体艺术领域的分享交流平台,高度重视自由表达和个人、机构正当权利的平衡。依照法律规定删除违法信息是数艺网社区的法定义务,数艺网社区亦未与任何中介机构合作开展此项业务。
2.受理范围
受理数艺网社区内侵犯机构或个人合法权益的侵权举报,包括但不限于涉及个人隐私、造谣与诽谤、商业侵权。
a.涉及个人隐私:发布内容中直接涉及身份信息,如个人姓名、家庭住址、身份证号码、工作单位、私人电话等详细个人隐私;
b.造谣、诽谤:发布内容中指名道姓(包括自然人和机构)的直接谩骂、侮辱、虚构中伤、恶意诽谤等;
c.商业侵权:泄露机构商业机密及其他根据保密协议不能公开讨论的内容。
3.举报条件
用户在数艺网发表的内容仅表明其个人的立场和观点,并不代表数艺网的立场或观点。如果个人或机构发现数艺网上存在侵犯自身合法权益的内容,可以先尝试与作者取得联系,通过沟通协商解决问题。如您无法联系到作者,或无法通过与作者沟通解决问题,您可通过点击内容下方的举报按钮来向数艺网平台进行投诉。为了保证问题能够及时有效地处理,请务必提交真实有效、完整清晰的材料,否则投诉将无法受理。您需要向数艺网提供的投诉材料包括:
a. 权利人对涉嫌侵权内容拥有商标权、著作权和/或其他依法可以行使权利的权属证明,权属证明通常是营业执照或组织机构代码证;
b. 完整填写的通知书;附供下载的:侵权投诉通知书;
c. 举报人的身份证明,身份证明可以是身份证或护照;
d. 如果举报人非权利人,请举报人提供代表权利人进行举报的书面授权证明。
e. 为确保投诉材料的真实性,在侵权举报中,您还需要签署以下法律声明:
(1) 我本人为所举报内容的合法权利人;
(2) 我举报的发布在数艺网社区中的内容侵犯了本人相应的合法权益;
(3) 如果本侵权举报内容不完全属实,本人将承担由此产生的一切法律责任,并承担和赔偿数艺网因根据投诉人的通知书对相关帐号的处理而造成的任何损失,包括但不限于知乎因向被投诉方赔偿而产生的损失及数艺网名誉、商誉损害等。
4.处理流程
出于网络平台的监督属性,并非所有申请都必须受理。数艺网自收到举报的七个工作日内处理完毕并给出回复。处理期间,不提供任何电话、邮件及其他方式的查询服务。 出现数艺网已经删除或处理的内容,但是百度、谷歌等搜索引擎依然可以搜索到的现象,是因为百度、谷歌等搜索引擎自带缓存,此类问题数艺网无权也无法处理,因此相关申请不予受理。您可以自行联系搜索引擎服务商进行处理。 此为数艺网社区唯一的官方侵权投诉渠道,暂不提供其他方式处理此业务。 用户在数艺网中的商业行为引发的法律纠纷,由交易双方自行处理,与数艺网无关。
免责申明
1.数艺网不能对用户发表的回答或评论的正确性进行保证。
2.用户在数艺网发表的内容仅表明其个人的立场和观点,并不代表数艺网的立场或观点。作为内容的发表者,需自行对所发表内容负责,因所发表内容引发的一切纠纷,由该内容的发表者承担全部法律及连带责任。数艺网不承担任何法律及连带责任。
3.数艺网不保证网络服务一定能满足用户的要求,也不保证网络服务不会中断,对网络服务的及时性、安全性、准确性也都不作保证。
4.对于因不可抗力或数艺网不能控制的原因造成的网络服务中断或其它缺陷,数艺网不承担任何责任,但将尽力减少因此而给用户造成的损失和影响。
协议修改
1.根据互联网的发展和有关法律、法规及规范性文件的变化,或者因业务发展需要,数艺网有权对本协议的条款作出修改或变更,一旦本协议的内容发生变动,数艺网将会直接在数艺网网站上公布修改之后的协议内容,该公布行为视为数艺网已经通知用户修改内容。数艺网也可采用电子邮件或私信的传送方式,提示用户协议条款的修改、服务变更、或其它重要事项。
2.如果不同意数艺网对本协议相关条款所做的修改,用户有权并应当停止使用数艺网。如果用户继续使用数艺网,则视为用户接受数艺网对本协议相关条款所做的修改。
阅读并同意此认领协议方可认领案例
*认领案例的操作记录无法自行删除,请务必确保您参与该案例身份的真实性