【新智元导读】商汤在《营造法式》中,发现了贯通古今的构造密码——标准化、模块化,而这,也正是AI如何落地的秘诀。
在2022世界人工智能大会上,商汤的展品让在场的人们感到深深的震撼。在上海世博中心银厅外,由中央美术学院副院长、实验艺术学院院长邱志杰教授创作,结合商汤AI+AR技术赋能的7.5mx3.7m的「智会世图」巨作呈现了上海人工智能五周年的成果。还有在现场当起了迎宾员的AI数字人「小糖」。她的神态和动作已经达到了栩栩如生的拟人效果。在商汤的徐汇西岸展区,还有一个独特的建筑模型展项。
佛光寺被誉为「古建筑第一瑰宝」,有「亚洲佛光」之称,于中华民族、于国家历史都意义重大、影响深远。
在此,抱着助力文化遗产数字化保护和传播的愿望,商汤借助AI+AR之手,重现了唐代建筑的恢弘与普惠之美,拆解了榫卯结构和古人的能工巧匠之智。仔细看这座模型,飞檐翘角、出檐深远、斗拱雄大,大唐的恢弘气象,在俯仰之间尽显。在85年后的今天,商汤利用了计算机视觉开源算法体系OpenMMLab中的MMEditing,对两位大建筑家梁思成、林徽因当年拍摄的老照片进行了AI上色复原,生动地再现了两人对佛光寺的发现过程,在场的人无不为之动容。
AI让佛光寺大殿的重现让我们对人工智能科研创新之路有了新的思考。
在WAIC 2022上,商汤科技董事长兼CEO徐立就此提出一种全新的理念,即「AI的营造法式」。
当前,业界提到最多的便是科研创新范式,通过经验归纳、推理演绎、仿真模拟,再到大数据这种既定的理论体系和框架来推动人工智能的发展。那究竟什么是「法式」呢?简言之,就是法度、制度、标准的格式。《营造法式》中,有一张「圆方方圆图」,揭示了一个正方形的边长和它外接圆的直径,或者它对角线的比是1:√2。
就像帕提农神庙一样,佛光寺无论是整体还是局部,甚至是内部塑像,都在反复地使用方圆之间的比例。无论是西方绘画、西方建筑,还是中国古代建筑,这一个道理都贯穿始终——「没有规矩,不成方圆。」而人工智能的营造法式,便是AI建造生产的标准方式。1925年,24岁的梁思成曾收到父亲梁启超寄给他一本巨著——北宋李诫的建筑学著作《营造法式》。书中认为,「凡构屋之制,皆以材为祖。」徐立在演讲中认为,「材」就是模块。而模块的标准化,能大大提高效率。可见「AI如何落地」和「如何造好一座塔」,其实是相通的。无论在人工智能还是建筑领域,标准化都是基础设施。只有标准化做好,才能快速复制、迁移到不同场景。医疗、游戏、智慧城市、汽车等领域,虽然看似不同,其实可能是采用同一种标准化的人工智能模型。当我们拥有的模型足够多,就能够成为标准件,并通过这些标准件,就能快速实现产业化的落地。就像你可以用3000个常用汉字,进行各种组词、造句一样。现在,商汤已经拥有4.9万多种AI模型,「实际上这个世界上本无标准化,当定制化成规模的时候,这便有了标准化。」当今,我们都在关注人工智能普行业如何规模化落地,如何降低成本。最佳路径就是,从定制化到标准化,最终成为行业的标准化基础设施。除了结构、模块的标准化,流程和生产同样也要标准化。例如全自动的数据标注,就能够大大降低生产成本。我们可以发现,标准化、模块化是人工智能的必由之路,而只有构建强大的基础设施,才能促进人工智能的标准化,更好地降低成本,推动落地应用。
「没有规矩,不成方圆」,这是一句古训,也是世间万物运转亘古不变的真理。
《营造法式》中的「以材为祖」秘诀,商汤将之灵活演变为人工智能的 「规矩」——AI的标准化,这一「规矩」使得商汤在各行业的AI项目快速落地,无论是基础云服务,还是智能汽车、游戏、智慧城市、智慧商业、智慧医疗等等。商汤在世界人工智能大会上,就发布了以下四款令人耳目一新的产品。SenseCore商汤大装置AI云
大规模商业落地的阶段下,人工智能产业有几个核心痛点:工业级应用所需的高性能AI模型生产成本高昂;AI模型开发效率低导致无法满足市场的大量需求;长尾问题因低频且数据量低而难以训练高性能AI模型等等。针对这些痛点,商汤打造了基于商汤AI大装置的云计算产品与服务。在具体介绍这个AI云之前,我们首先需要了解一下什么是SenseCore商汤AI大装置。简单来说,AI大装置是商汤打造的高效率、低成本、规模化的新型人工智能基础设施。值得一提的是,商汤为AI大装置自主建立了一个全新的人工智能计算中心(Artificial Intelligence Data Center,简称AIDC),可实现批量的算法模型生产、部署和迭代升级。其设计的峰值算力高达4910 Petaflops(1 Petaflop等于每秒1千万亿次浮点运算),可完成10000亿参数模型的完整训练。在此基础上构建的深度学习平台,则实现了从数据存储、标注到模型训练、生产、部署、测试的全链路、批量化过程。目前,商汤已经基于深度学习平台,开发了超过46000个算法模型。于是,有了AI大装置的支持,一套开箱即用的工业级AI工具链就诞生了——SenseCore商汤大装置AI云。具体讲,它是普惠、弹性、开放的AI基础设施,最大的特点便是「开箱即用」。首先普惠是让每个人都能用得上AI。目前来看,人工智能的应用成本较高,对于一些初创企业来讲,便会阻碍AI的创新想法的落地。商汤通过云计算模式来加速AI开发能力,再把AI的部署能力开放,进而大规模降低AI落地成本。依据商汤在像智慧城市、智慧生活、智慧医疗各个领域,都有很多的行业AI落地经验。因此可以发现,不管是AI的训练,还是推理,都有很大的潮汐特性。比如商汤视觉大模型训练,其周期一般持续数天或数周。当这一周期结束后,便可以把资源弹性释放给其他任务去使用。AI推理同样如此。最后,开放是指SenseCore未未来将全面开放和上下游软硬件厂家的合作。现在,SenseCore商汤AI大装置,包括AI云产品都会全面开放。此外,商汤也会提供自家的AI软件,还有一些AI SaaS软件ISV,进而形成一个全面的合作。目的是以这一产品为核心,聚拢AI行业的力量,去建立整个国产化的AI生态。从产品架构来看,SenseCore AI云计算产品和服务可分为三层:SenseCore AI原生基础设施层、深度学习平台层、算法模型层。可以看到,SenseCore商汤大装置AI云具备卓越的可扩展性,可有效应对未来工业AI流水线以及 AI大模型的训练、验证、推理需求,帮助客户实现AI研发效率的成倍提高,以及更低的AI基础设施费用,并提供全栈式深度学习平台以及一系列先进的算法平台和模型。有了这一基石,商汤便可以推动AI在自动驾驶、智慧城市、AI for Science及元宇宙等多个应用场景的数字化和智能化发展。SenseMAP商汤多体智能平台
自游戏诞生以来,如何让游戏变得更加趣,游戏的生产过程更加高效,一直是游戏从业者思考的问题。直到AI的诞生,为解决这个问题打开了一个新的思路。特别是AlphaStar在《星际争霸2》中以5比0的比分,击败了顶尖职业级玩家之后,AI智能体一跃成为行业关注的全新方向。为此,商汤开发了一款专为游戏生产和运营量身定做的平台型产品——SenseMAP商汤多体智能平台。SenseMAP商汤多体智能平台提供的功能可以说是涵盖了整个游戏的生产周期,包括游戏内智能体(智能决策,智能交互,智能生态),游戏外智能体(智能客服,智能运营),智能内容生产(角色立绘、设定,地图生成,动作捕捉,人脸3D生成)。游戏内智能体,顾名思义,就是让AI控制的NPC在不管是聊天还是在行为上,都更接近于真实的玩家。其中,接近人类的决策行为需要以监督学习和强化学习结合的方式,基于大量真实玩家的游戏数据进行训练。同样,交互行为也需要通过对游戏中聊天数据的训练,才能让AI无论是响应公会盟主号召,还是主动和新手玩家打招呼,皆可胜任。而游戏外智能体,则是利用针对游戏语境下的专用术语建立知识图谱,配合23个小语种的翻译模型,为玩家提供智能运维客户服务。虽说想把上面这两点做好很难,但「智能内容生产」这个功能显然更加新鲜。例如,通过三维重建、Avatar风格化等多种手段,立绘的生产周期能从以「月」为单位变成以「天」甚至「秒」为单位,并且还支持超写实、拟真人、不同风格卡通形象等多种模式。此外,在地图这边,2D、3D以及手绘等各种美术素材生成,也都能交给SenseMAP去搞定。SenseAuto V2X商汤绝影车路协同
除了游戏,超过百年历史的汽车工业也正在AI技术的驱动下,发生着翻天覆地的变化,人类出行的安全度、舒适性、效率正在往全新阶段爬升。纵使当前的智能驾驶汽车设计了极其复杂的一套系统,由于其所处的实际驾驶环境要素繁多、复杂多变,使得自动驾驶车辆在安全方面仍然存在许多不确定性。
单车智能驾驶的安全性目前主要涉及感知、预测、决策、控制和人机交互共五个大的方面,其中感知和预测是目前面临的突出问题。为此,结合激光雷达、摄像头、毫米波雷达等基础感知设备,商汤绝影基于自身在智能汽车、智慧城市等领域的长期技术沉淀和场景思考,打造了完整的SenseAuto V2X绝影车路协同平台。通过一体化分析决策方案,对车端、路端信息融合处理、分析,实现「车-路-云」一体化决策控制,构建更安全、更高效的交通环境。举个例子,就拿在本次人工智能大会上首次亮相的商汤绝影自动驾驶清扫车来说,从名字上就能看出,它首先是一辆具备自动驾驶能力的功能车。
在车路协同的加持下,这辆拥有聪明大脑的自动驾驶功能车,不仅可以利用云端提供的「上帝视角」,弥补自身近处的盲区来避免碰撞,而且还能「预知」远端的道路信息,提前避让堵塞点。甚至,还可以通过云端提供的精准的可行驶区域,将贴边距离缩小致5cm,进而把清扫的覆盖率提高至90%。一直以来,因为需要大量基础设施的投入,车路协同的整体规模化落地存在着不小的挑战。
作为人工智能软件公司,依托SenseCore商汤AI大装置强大算力支撑,绝影能够以高效的数据闭环实现算法的快速迭代,并通过OTA推动「车-路-云」端能力的持续升级,从而实现“硬件一次投入,软件持续升级”。
通过软件定义的方式降低硬件基础设施的边际成本,商汤绝影将让车路协同以更低成本、更高效地实现规模化落地成为可能。
商汤未来医院整体解决方案
所谓的「未来医院」,是商汤为医院提供的全栈式“未来智慧医疗”服务新模式,旨在加速高质量医院转型进程。其中,面向诊疗环节的SenseCare智慧诊疗平台,是商汤自主研发的一套集领先AI算法与丰富影像后处理技术的高性能辅助诊疗解决方案。该平台提供了覆盖全身多部位、多病种的全流程AI辅助,全面满足影像科、骨科、肝外科、心内科、病理科、胸外科、放疗科等多科室的临床诊疗需求。目前,这个赋能医生诊疗的一站式AI平台已在众多顶级三甲医院及行业领先的医疗机构落地,例如,浙江大学医学院附属邵逸夫医院在很早之前就开展与商汤的合作,引入针对肝脏CT、肝脏MR的AI应用以辅助诊断,同时肝脏智能手术规划系统也已经在肝胆外科落地应用,帮助医生高效快速地完成腹部疾病的诊疗工作,服务临床诊断-治疗-康复全流程。与此同时,SenseCare也支持通过云服务的形式赋能基层医院,以较低的成本推动顶级专家资源下沉,以上海市杨浦区中心医院为例,通过专网入云方式快速接入SenseCare智慧诊疗平台,通过引入针对胸部CT和冠脉CTA的智能阅片辅助,提升临床诊疗效率和精度。此外,除了面向诊疗环节的SenseCare智慧诊疗平台,商汤就不同场景还推出不同的服务。面向患者就医的「智慧就医」助手、面向医院管理的「智慧管理」服务、面向科研层面的「智慧科研」服务,以及面向区域医联体的「智慧医联体」服务。可以看到,商汤充分把人工智能的 「规矩」应用到了各行业,无论是基础云服务,还是游戏、汽车、医疗、智慧城市等。借助AI的赋能,商汤打通了算力、算法和平台,实现了高效率、低成本、规模化的AI创新和落地。就如同我国的古代匠人精心地盖好每一座塔,商汤在认真地促成每一块领域的AI落地。