- 0
- 0
- 0
分享
- AI未来趋势大揭秘|“技术+产品”的双杀,看2024WAIC显眼包花式整活
-
原创 07-11
从2018年第一届开始,WAIC世界人工智能大会就已成为全国乃至全球的AI风向标。根据官方数据,本届WAIC有500+家企业确认参展,展品数量已超1500项。
比起高深的算法对垒、高端的大佬对话,更让广大观众为之瞩目的是现场展商们竞相展示的“黑科技”。现实版的“百模大战”、列队展示的“十八金刚”人形机器人是本届WAIC的重要看点。
“百模大战”,聚焦AI助理&视频生成
近年来,国产大模型发展迅速。根据国家网信办数据显示:截至2024年3月,已有117家“大模型”成功备案。在本届WAIC现场,各类大模型以各自独特的技术优势和应用场景吸引了众多目光,特别是AI助理与视频生成领域,已然成为大模型厂商的发力重点。
AI助理,让生活工作更便捷
阿里云的AI编程助手通义灵码入选WAIC“镇馆之宝”。
通义灵码精通200多种编程语言,可以辅助写代码、读代码、查Bug、优化代码,下载量超350万,每日辅助开发者生成代码超3000万次,已广泛应用于金融、制造、互联网、交通、汽车、能源等行业。
蚂蚁集团的支付宝智能助理是支付宝推出的对话式AI助手,是本届WAIC“镇馆之宝”之一。它围绕用户的吃、喝、行、游、办事、买票、娱乐等数十种生活场景,比如当用户向它说“帮我点一杯美式咖啡”,它可以自动下单。
金山办公也升级了自己的AI助理WPS AI,本届WAIC现场,WPS AI全新增加AI写作助手、AI阅读助手、AI数据助手、AI设计助手,进一步提高个人用户的办公效率。
AI赋能视频生成领域,不断降低创作门槛
商汤科技面向C端用户发布的可控人物视频生成大模型Vimi,被评为“镇馆之宝”之一。Vimi基于商汤日日新大模型,可以仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频。写真视频、数字分身、表情包等,头发、服饰、背景变化、光影变化等都能自动生成,而且手势、头发和肢体十分合理、自然、和谐,不会显得呆板和失真。
作为全球首个用户可用的真实影像级视频生成大模型,快手的可灵一经问世便引发了强烈反响。
在WAIC快手宣布可灵AI基础模型再度升级,推出更清晰的高画质版,以及首尾帧控制、镜头控制等全新编辑能力。
同时,可灵在运动生成、生成时长、物理规律、视频画质、指令响应、图生视频、视频可控性等七个方向的能力进一步升级,创作者可单次生成更高清更可控的10s及更长的视频。
阿里达摩院的一站式AI视频创作平台“寻光”,主打视频编辑功能。AI视频内容的可控编辑,包括对复杂剧情的理解、生成对象的一致性等,仍然是当前算法所面临的一大挑战。
寻光可以辅助用户创作剧本、分镜图等,支持对生成及上传素材进行丰富的AI编辑,包括人物控制、场景控制、运镜控制、目标新增/消除/修改等10多种功能,并且在交互方面,主打“让视频编辑像操作PPT一样简单”。
各类大模型“百花齐放”
合合信息旗下扫描全能王携手华南理工大学团队,将AIGC技术应用于敦煌遗书残卷的图像数字化修复上,共同打造了AI古籍修复模型。
在扫描全能王智能高清滤镜算法的加持下,该模型具备优秀的图像处理能力,可助力古籍文献中存在的模糊、阴暗等图像质量问题的解决。
基于待修复区域的内容和位置先验信息,该模型可智能学习不同古籍文字风格、纸张背景,对损坏区域的字体内容、风格进行高度还原,尽可能确保修复区域的文字风格和背景与原古籍的一致性,做到“修旧如旧”。
猿辅导旗下看云软件推出的Motiff妙多,首创AI复制、AI布局、AI设计系统创建、AI设计系统维护、AI一致性检查等多个AI功能,是国内首个自研图形渲染引擎的界面设计软件。
大模型独角兽阶跃星辰现场展示的Step-1X图像生成大模型能熟练处理从简洁到繁复的文本指令,涵盖从单一对象的基本描绘到蕴含多层次信息、情感与文化内涵的复杂场景构建,实现文本到图像的无缝转换,还能将中国风的美学精髓融入其中。
同时现场也有厂商带来了内测中的产品demo。MiniMax展出内测中的AI音乐生成abab-music,预计下半年发布;MiniMax创始人、CEO闫俊杰现场透露,MiniMax的AI视频生成产品将在下个月(8月)面世;百川智能也带来了内测版医疗应用AI健康顾问,预计Q3发布……
从基础模型到行业模型,从语言模型到多模态模型,国产大模型正以前所未有的速度在各个领域开花结果。
“十八金刚”人形机器人,具身智能成为大热门
人形机器人阵列18台不同技术架构机器人同时向来宾挥手时,场面颇为壮观。
这18位人形机器人的代号分别是青龙、X02-LITE、清宝机器人、智元远征A2、傅利叶GR-1、电科机器人一号、星动1号、开普勒先行者K1、小蟹、夸父4代、XR-4、H1、Song、光华一号、钛虎瑶光
主办方数据显示,本届大会合计展出的人形机器人超过25款。几乎每家机器人公司都在宣称自己做的是具身智能。
“具身智能,简单来说就是有一个身体,再加上一个机器人智慧的大脑。”一位展商直白地向来宾解释。
人形机器人“青龙”国家地方共建人形机器人创新中心正式发布了国内首款全尺寸通用人形机器人公版机——“青龙”,同时宣布开源其技术。据介绍,“青龙”身高185厘米,体重80公斤,最大关节峰值扭矩400牛米,算力支持400Tops,拥有高度仿生的躯干构型和拟人化的运动控制,支持多模态机动、感知、交互和操控,全身多达43个主动自由度,支持快速行走、敏捷避障、稳健上下坡和抗冲击干扰等四大运动功能。
在国内首次亮相的特斯拉二代人形机器人Optimus的全身控制能力和平衡性再次进化,在直立行走的基础上,行走速度提升了30%,十个手指进化出感知和触觉,借助视觉神经网络和FSD芯片,可校仿人类的操作进行电池的分拣训练。
宇树科技展出了通用人形机器人H1、工业级四足机器人B2和消费级四足机器人Go2。其中宇树 H1于2023年推出,是全球首款拥有原地后空翻能力的全尺寸电驱人形机器人。它的身高约180厘米,体重约47公斤,移动速度每秒可达3.3米;采用360°全景深度感知技术,能够精确感知周围环境的深度信息。
乐聚公司旗下的“夸父”(KUAVO)是国内首款搭载鸿蒙操作系统的全尺寸人形机器人,是“盘古大模型+夸父人形机器人+开源鸿蒙系统”深度融合的产品。夸父重约45kg,全身26个自由度,行走速度最高可达4.6km/h,可快速连续跳跃,跳跃高度超20cm,搭载自研一体化关节和深度摄像头,可实现全方位视觉感知。
云深处专注于四足机器人的研发及应用,现场展示了“绝影X30”的较大四足机器人展现了它灵活上下楼梯的样子,它能够在-20℃到55℃的极端环境下作业,也适用于电力巡检、应急救援、消防侦查等领域。
随着技术的浪潮不断向前,大模型与人形机器人等前沿“黑科技”编织出一幅AI技术全面发展的壮丽图景。这一融合不仅深化了AI技术的内核,更拓宽了其应用边界,使之在医疗、教育、制造、文化等多个领域落地生根。
来源:世界人工智能大会、商汤科技、阶跃星辰、扫描全能王、蚂蚁集团、WPS AI等官方公众号/网站
-
阅读原文
* 文章为作者独立观点,不代表数艺网立场转载须知
- 本文由 文化科技融合汇 授权 数艺网 发表,并经数艺网编辑。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 本站部分文字及图片来源于网络,如侵犯到您的权益,请及时告知,我们将及时处理或删除。