- 0
- 0
- 0
分享
- 最炫黑科技还得谷歌!一副眼镜告别学外语,一个地图App在家沉浸式环球游
-
2022-05-20
梦晨 鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI
今天凌晨,谷歌又用AI来炸场子了,还是直接塞到手机App里的那种。
现在,在地图软件里,你不仅能3D看街景,连餐馆内部都能无缝“进入”。
地图还会将实时交通、天气等信息叠加到你想去的地方,属实是一把子沉浸式体验了。
而这,还只是今年谷歌I/O大会的冰山一角。
谷歌CEO皮猜还在现场祭出了这样一个“法宝”:
不错,时隔10年,谷歌再战AR眼镜。
这次的概念产品外观上不像上次那样前卫,但功能上依旧未来感拉满。
带上它就能把听到的外语翻译出来,以文字的形式融合到现实场景中,也难怪这位试戴者一脸不可思议状。
戴上眼镜后的第一视角看起来是这样的:
两个说着不同语言的人无障碍聊天,同时还不耽误眼神交流。
谷歌AI掌门人Jeff Dean把这个功能形容为:给世界加上字幕。
有网友认为,像这样把人与人连接在一起是科技最好的一面。
有听力障碍的网友则表示,我现在立刻马上就要这个。
像这样用AI技术推动一个个产品脱胎换骨,正是这次I/O大会的主线。
包括但不限于:
给真实世界加上“Ctrl + F”的多模态搜索;
谷歌翻译新增支持24种语言,并且采用新的单语机器学习方法,可以在没有现成翻译参考的情况下,直接去学习翻译新语言且质量达标;
更加强大的AI聊天机器人;
……
具体详情,我们一起来看。
更多AI应用炸场
搜索这个老牌业务,如今在图文多模态技术加持下焕然一新。
如果偶然看到让你流口水的美食,现在不光可以用图片搜出菜名,只需再加上“在我附近”的提示词就能一键直达相关餐厅。
如果在超市货架上挑巧克力挑花眼,现在掏出手机就能让商品评分一览无余,还能按关键词筛选出“黑巧克力”以及“不含坚果成分”。
给现实世界加上“Ctrl+F”。
来自谷歌旗下Deepmind的文字+音频+视频的多模态理解和生成技术,也落地到了全球最大视频网站Youtube。
用AI给视频自动分出章节和生成描述,让观看者可以一键直达感兴趣的部分,也为内容创作者节省大量时间。
聊天机器人也靠不断进步的AI大模型能力得到新的突破。
如去年首发的对话模型LaMDA,今年已升级到2代,并且开放了Demo体验。
首批开放的三个功能中第一个是“想象”,可以要求AI设想一个不存在的场景,并在互动中不断深入下去,帮人类在创意活动中获得更多灵感。
此外还有“计划清单”,和“随便聊聊”。
前者可以告诉你要完成一个目标需要哪些步骤。后者则是看看AI到底脑洞有多大。
用新一代AI架构Pathway训练出来的5400亿参数大模型PaLM通过“思考过程提示”获得更准确的逻辑推理能力,减少AI生成内容中的错误和胡言乱语。
远程办公大趋势下,谷歌Workspace也上新了AI能力帮人类提高工作效率。
对一篇文档自动生成摘要已是“基操勿6”,对一段聊天记录生产总结减少“爬楼”则更让人眼前一亮。
最后,支撑上面这些AI能力落地的是大型AI计算中心。
谷歌这次宣布,美国俄克拉何马州的全球最大开放机器学习中心正式对外开放。
搭载8个Cloud TPU v4 Pods集群,提供每秒900亿亿次浮点运算的峰值算力,并且所用的90%能源都是无碳绿色能源。
谷歌新品很苹果
讲完酷炫的AI,本次I/O大会重磅发布的还有一系列硬件产品。
刚才说到,谷歌的数据中心拥有高度定制化的TPU芯片,而在移动端,其智能手机新品Pixel 6a也搭载了谷歌自家的Tensor芯片。
去年,Pixel 6和Pixel 6 Pro已经搭载了该款SoC。谷歌表示,这将让手机更直接地发挥出谷歌语音识别等AI技术的能力。
根据Anandtech的测试,从跑分上来看,初代Tensor性能接近骁龙888。
△图源:AnandTech
而此前备受关注的第二代Tensor芯片的消息,也在I/O大会上有所透露:将配备到今年秋天推出的Pixel 7系列上。
至于具体性能,就只能拭目以待了。
另外,谷歌还发布了首款智能手表Pixel Watch。
此设备主要由去年谷歌花21亿美元收购的Fitbit开发。
以及首款主动降噪蓝牙耳机Pixel Buds Pro。
再加上同样搭载Tensor芯片的平板电脑产品消息的释出,以及安卓13设备“手机复制、平板粘贴”的新功能,谷歌这一波全家桶更新,多少是有点苹果内味儿了(手动狗头)。
当然,这样的变化也是不少网友喜闻乐见的:
谷歌生态终于好起来了。
受疫情影响,经历一年停办、一年全程线上举办之后,谷歌I/O大会终于再次回归线下。
简单总结一下,这一次的谷歌I/O大会,看似乱花迷人眼,但核心的主旨也很明确了。
用谷歌自己的话说,就是基于知识和计算,来让产品变得更有用。
那么,作为世界上最受关注的开发者大会之一,今年的谷歌I/O大会你觉得够分量吗?
参考链接:
[1]https://mp.weixin.qq.com/s/LROdPhenTe_AIsU88FEXZw
[2]https://blog.google/products/maps/three-maps-updates-io-2022/
[3]https://www.theverge.com/2022/5/11/23066813/google-io-2022-live-blog-keynote-announcements-android-pixel-watch?scrolla=5eb6d68b7fedc32c19ef33b4
关于恒滨传媒科技
About HENGBIN MEIDIA TECHNOLOGY
杭州恒滨传媒科技发展有限公司,是一支由艺术科技实践者、视觉艺术家、设计师、软件工程师、机械工程师组成的创新跨界新锐团队。
我们专注于光影艺术、多媒体交互、沉浸式体验、3D全息视效、艺术装置、VR虚拟现实/AR增强现实/MR混合现实等领域的开发应用。
别出心裁的创意、专业的解决方案和精彩的呈现,我们在创新跨界的方向上一路探索。
将想象呈现于视界
-
阅读原文
* 文章为作者独立观点,不代表数艺网立场转载须知
- 本文内容由数艺网收录采集自微信公众号恒滨数媒 ,并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 如您不希望被数艺网所收录,感觉到侵犯到了您的权益,请及时告知数艺网,我们表示诚挚的歉意,并及时处理或删除。