- 0
- 0
- 0
分享
- 震撼之后,Sora会改变影视娱乐行业吗? | 业内闲聊
-
02-24
Sora生成视频发布后,东西文娱邀请影视、AI创作者、AIGC创业者和投资人等领域的业内人士围绕下述问题做了一个交流。
① 看到OpenAI发布的sora视频后,有怎样的观感?
② 如何评价市面上的AI视频生成工具?
③ 目前围绕sora的讨论不少都指向了影视行业,sora会给影视行业带来怎样的影响?
④ sora对AI视频创业公司来说意味着什么?
⑤ sora的推出会引发怎样的产业变化?
⑥ 关于sora还有什么问题是你很关心的?
话不多说,直接上正文。
看到OpenAI发布的sora视频后,有怎样的观感?
首先是震撼,因为不仔细分辨,已经无法区分是否实拍,这比之前普遍使用的runway等AI生成软件在动态表现和稳定性上有了质的飞跃,基本上达到了专业影视生产的水准。
第一个观感是天要塌了,或者说在做梦。看到那个人走在东京街头的视频,我说这简直是不可能的事情。至少我们现在做的AI影视工具根本达不到这个程度。第二个感受是机会来了。这是就我个人而言。我之前自己做《山海奇镜》片子,内心还是会有很多担忧。
比如说镜头时长的问题,动作幅度的问题,物体和物体之间交互的问题。这些问题都在目前来看,除了sora以外,其他家的模型在解决上都有困难。
我当时看到海豚在沙滩上骑自行车的视频,那是让我最兴奋的,因为这意味着Sora不仅能生成现实感的东西,它一样能基于现实的物理规律生成荒诞的东西。
我觉得这会是未来sora真正投入使用以后,第一波能够吸引大众眼球的内容。人们看到AI生成真实的场景不会那么兴奋,但是这种一看就知道是假的场景,在传统时代制作要花很多时间精力,现在AI迅速生成,是很吸引眼球的。
大家一开始一定是看奇观的。
我相信大部分关注视觉生成的朋友们应该都非常震撼。一早上醒来收到新闻链接的时候,以为会是比其他视频生成公司略好的效果,但是看到demo的时候,直接被惊艳得清醒了。
不知道大家之前有没有觉得一些文生图、文生视频模型生成出来的人物形象很假、很阴间,我一直百思不得其解,直到看到Sora演示视频的时候才恍然大悟,之前模型生成人物的眼神是呆滞、没有光彩的,表情也是皮笑肉不笑的,所以没有人的灵动感。而Sora生成的人物瞳孔是倒映着真实的外部环境的,模拟了真实的光线反射,再加上符合生物特性的动作、步态以及表情变化(当然还有很多瑕疵),这些细节感让人物显得非常逼真;而且Sora生成的视频中元素的一致性非常非常高,确实吊打了一众友商。
在被惊艳的同时,保持观望。
OpenAI 总是提供很好的范式,DallE2,GPT, Sora.. 但至今你都没办法让 DallE2 画具体某个游戏画风的角色/场景,由于数据集本身的多样性不够,导致没有办法做具体的项目风格,风格没有办法自定义,对于大多数商业项目来说就没有意义,即实用性很低。
很振奋。Sora是我目前看到唯一真正跳脱出空镜头生成、真正的视频生成工作,从目前的结果来看跟Pika、Runway是有代差的。
视频生成领域终于被OpenAI支配。很希望3D领域也有朝一日能体会到这种恐惧。
但同时也开始思考:DallE、Sora这类项目与实现AGI之类的联系是什么?第二天OpenAI的技术报告给了我答案:一个世界模拟器,让AGI拥有无限训练数据。
更多的可能性,这是sora带给我的第一感觉。
虽然sora的技术细节并没有彻底公开,但是通过open ai已经披露的信息和最近社区激烈的讨论来看,sora有三方面的信息非常值得我们注意:首先是Sora依然是以transformer和扩散模型为基础的产品,这说明transformer和扩散模型中依然有非常多的潜力值得我们去挖掘;
其次,Sora训练用的数据是视频而非传统语言大模型和扩散模型一样使用语料和图片,一样起到了非常不错的效果,这使我们可能有更多的遐想,是不是更多领域的数据都可以经过特定处理后成为训练大模型的数据集并且产出有价值的结果,是否大模型技术不仅仅可以用于生成甚至可以用于科研分析领域等等;
最后,在Sora的技术中,有非常明显的计算机图形学相关的三维场景计算的能力体现,甚至可能有物理引擎参与其中,这是一次非常有意义的尝试和突破,未来可能会有更多跨领域的产品和技术出现,这让我非常期待。
是否用过一些AI视频生成工具,这些工具起到了怎样的作用?
之前都是辅助工具,用来找设计方向、以及一些概念预告片。
我是去年11月份开始关注到AI影视,当时Pika很火嘛。后来我认识了Pixverse合伙人,就用他们的产品试着做了《山海奇境》的预告片。
我希望做纯AI的短剧,至少在画面层面。就是类似《逃出大英博物馆》的那种精品短剧。
AIGC是我们基金的重点投资方向,所以工作中试用过不少国内外的文生视频、图生视频工具,不管是以动作幅度大见长还是强调细节动态性的模型,说实话都很拉垮,当然也有可能我们不是专业人员,或者确实需要一些频繁的抽卡行为。
虽说这些模型的能力还差强人意,但我们了解到视频生成模型确实已经被用在了一些构图比较简单的广告制作中(也包括换脸),尤其在电商领域,大家整体的接受度都比较高。
工作流在发生变化。
AI 在视频行业带来的最大的变化,以前影视制作前中后三期泾渭分明,我们前期设计、中期拍摄、后期制作;现在则在后期阶段也会不断生成新的素材,甚至定义新的设计。工作流的压缩必定带来新的工具需求。
我使用过Runway与Pika,甚至给Pika充了会员。这些工具确实帮到我了,但坦率的说并没有达到预期。
我原先以为这些工具可以使用在素材生成中,原先一些需要寻找甚至购买的视频素材,可以直接获得——但是Pika与Runway都没有到达这个质量,会出现很多明显不合理与不稳定的地方。后来我使用Pika帮助我把一些静态图像变成微微运动的视频,这能节约我的一些时间但不是很多。
OpenAI在Demo真实性上信誉一向很好,相信Sora的输出质量与OpenAI在twitter上展现的不会有太大差距,也许Sora能够满足我当时的需求。
我之前使用过剪映的图文成片功能和GPTs中一部分文生视频工具,还有一些第三方的图生视频工具。总体来说,在当今视频作为一种重要的信息载体的情况下,这些工具确实为有相关需求的人提供了一定的便利性,但更多的情况下,当前的AI视频生成工具的效果和成本距离理想的AI视频制作工具来说还相距甚远。
Sora之所以能够带来轰动,很大程度上是因为给我们带来了一个能够以较低的时间成本和算力成本就可以获取到极高质量的成果的预期,这是现阶段其他AI视频生成工具所达不到的。
目前围绕着sora的讨论
不少都指向了影视行业
你觉得sora会给影视行业带来怎样的影响?
首先肯定是心态的变化,要么忧心忡忡,要么兴奋不已。担心的一般都是人多、体量较大的公司老板,兴奋的是一些中小工作室和个人。
其次是内容生产的方式会变:复杂的工序可能会消失,变成傻瓜式的应用,人人都可以制作优质的画面。
第三以此会产生爆发式的内容,好的坏的,都会引发新的社会热点话题,甚至因为某些热点事件,影响我们的法律。
四秒时代,其实更多还是玩具的属性,没有办法拿它做商业化的交付,所以我们还不太能拿它当武器。但sora的出现是一个特别大的爆点,基本上把我身边所有的专业用户都炸醒了。
我的身边有一些电影导演,还有蛮有名的综艺导演,大的电影公司都已经来跟我表达说他们想要用这个做东西。
现在用AI的产品来直接跟消费者做交付其实是比较困难的。里边一定会有很多的瑕疵,这些瑕疵在短剧或者说短片里边大家是可以容忍的,因为买单模式不一样。
但你进电影院,如果看到有一个镜头在有一些地方是扭曲的,你肯定会骂人的。我觉得AI制作一开始会在短片或者说短视频短剧这些方面有应用,等到它完全趋于成熟了,才会用于大电影。
Sora最先面向的就是影视相关的行业,OpenAI也在让很多影视从业人员测试评估模型效果。我觉得视频生成模型会改变影视行业的生产方式已经是毋庸置疑的趋势了,我们也了解到很多国内耳熟能详的工作室和团队都在和海内外的多模态模型公司合作。
这次Sora隐隐呈现出的物理世界模拟更是让大家从对于“AIGC可以帮助生成概念图、概念视频以及辅助进行后期特效制作”的期许直接跨越到了“大模型或许可以直接生成影视级作品”的大胆设想。
虽然现在Sora还是有很多差强人意的地方,尤其在物理“理解”上还是小学生,但相信它的迭代速度会非常非常快,就像年前的我们完全想象不到OpenAI这么快就能推出Sora这样的产品。
我也很期待的是Sora未来能够降低视频创作的门槛,让很多有创造力的普通人都可以创作出精彩的视觉作品。
AI 除了由于生成能力极强,让生产变得前所未有的容易以外,也在创造新的交互范式的可能,其中就是用自然语言来改图/改视频,这在 GPT4 中已见雏形,在 Sora 的 v2v editing 中则显得更加吸引人。
首先我对很多人认为Sora会冲击甚至颠覆影视行业这一观点持保留意见。相反,我认为利用好Sora等文生视频工具可以赋能影视行业,能提升影视行业某些环节的效率,从而降低成本。
第一个是在动画制作中都需要做动态分镜,那现在我们可以利用Sora这样的工具来做。
第二个是在一些超级大片,尤其是幻想类题材,如科幻,魔幻等类型以前一般是会采用预拍摄技术,预拍摄就是指电影正式开拍前,通过彩排和预拍摄来将剧本可视化,让主创团队把电影中的细节都展现出来,让包括演员,灯光,摄影,录音等各项环节的工作者都能直观的知道每场戏要拍啥,演员怎样走位,整体上是什么样的效果,这样正式拍摄时各工种都目标清晰,从而提升拍摄效率,减少拍摄成本,因为就算中等规模以上的电影,每一天的成本都是百万体量。
那以后,也可以引入Sora这样的AI工具来将剧本可视化,就像先做一个demo一样,现场所有工作人员目标清晰且一致,就能大大提升拍摄效率。
首先可以非常确定的是CG视频制作领域会迎来巨大的变革,CG视频制作行业一直以来是基于计算机图形学的渲染技术来实现的,需要经历建模、贴图纹理、灯光、动画、粒子特效、渲染等等一系列成本极高专业性极强的过程。
而Sora的出现使这些都不需要了,一个调整好的Sora模型,只需要你告诉它你需要什么,你就可以获取到一段高质量的cg视频,毫无疑问这是一个巨大的进步,必然会对cg视频领域产生巨大的冲击,再以CG视频为起点,向整个影视行业进行辐射和扩散。
你觉得sora的推出会引发怎样的产业变化?
我从业的电影视效来说,先说好的
一、流程会变 传统的按部就班的流程会缩短,复杂的工序可能会简化。
二、效率提升 制作很久的几周甚至几个月的内容现在可能几个小时就能完成。
三、很多传统影视制作起来特别麻烦的内容对AI来说很简单,比如猫猫狗狗等动物、真实的人类、人群,复杂的粒子、流体。
四、利好中国科幻、玄幻产业,“穷”是卡在中国科幻影视的核心环节,而这个卡子,就是视效这个环节。Sora 会让很多复杂的特效镜头成本大幅度下降,让没钱的创作者也能做出优秀的画面来。
不好的消息
裁员:视效公司大量重复劳动的工作会减少,很多工种可能会消失。客户知道AI能省钱,于是降低预算,视效公司营收减少、利润降低,更难生存,间接影响我们的教育领域,影视专业的大学生学的课程毕业之后,大量公司倒闭、行业消亡,找工作更麻烦。所以对高校来说非常非常难,老师也不知道该怎么办,是继续教还是转学AI,会陷入迷茫。
被卡脖子:什么时候能做、我们能做什么取决于人家能让我们做什么,甚至极端情况,只要是中国的的公司都做不了。(当然,如果这样我们反而能够有自己的机会)
可能很多人会说摄像、灯光没活干了,拍摄的所有环节这些人都没活干了。我觉得影响最大的是可能大家现在都没有意识到的一个行业--艺人。影视制作行业里,只要是大片,占大头的成本是明星,这个是资本最想压缩的。
当然顶流我认为依旧会存在。但有非常多腰部腿部的这些人,真的会失去很多市场吧。
我认为未来数字人会取代真人的,因为真人身上有太多瑕疵。
假如未来真的算力足够。AI是不是能够根据你的潜意识,为你生成你想要的世界,那个时候你要艺人干什么?新的表演形式和新的人会出现并取而代之,不过这个时间肯定很长了。
我认为OpenAI做这件事儿的底层逻辑是,需要实现AGI,就需要一个“现实模拟器”,来生成无穷无尽的现实数据。3D应该不在射程范围内。音频在。
3D和文本、图片、视频的生成还是很不一样的,工业标准很重要,难点不在获取高度一致性的连续多角度图像,不然照片建模早就统治模型生产工作了。
Sora这种类型的工作往后做到高度可控性的话,要干掉的不是3D生成,而是整个CGI工业乃至游戏引擎。
到时候就是“图形学不存在了”。
首先是,我相信,所有的出品人,制片人,尤其是影视公司的老板们肯定都会积极拥抱,学习,探索,这对行业一定是好事。另外我觉得更大的变化,短期内可能会是在短视频领域,MV的制作领域,UGC的创作上,会帮助有才华,有想象力的创作者制作出更优质的内容来。
对于我们电影行业来说,还是应该不忘初心,戒燥,做好我们的本质工作,做更多的优质内容,打造优质IP。
技术层面的发展,不管是我们行业内影视拍摄,制作技术,放映技术,还是行业外VR,AR技术的发展,前几年的流媒体,近两年的元宇宙,现在如Sora这样的AI风口等等,对于我们来说都是为我们打造优质内容或者增加商业变现场景服务的,都只是工具。
我们还是不忘初心,扎扎实实做出优质内容来,打造出优质IP来,才能在这个AIGC迅速迭代的时代掌握我们自己的主动权。
sora可能引发的产业变化,前面已经说的比较多了,这里主要说一说在我们星图比特所在的审校行业会带来怎样的变化好了。
首先,视频审校本身就是AI审校这条道路上我们一定会去攻克的领域,Sora的出现为我们在这个领域的技术方向和产品设计方面提供了很好的思路和灵感;
其次,如前面我所提到的那样,我们也会尝试将更多的数据类型与大模型做结合从而能够做出优秀的产品能够为更多行业的用户解决问题与痛点;最后,我们可能也会考虑规划一些能够帮助科研工作者进行数据结果分析和预测方向的AI产品,当然这个路线上肯定会有许多难题需要攻克和解决,我们会努力的。
Sora发布之后,AI视频创业公司Runway CEO Cristóbal Valenzuela在X平台上简单发布了两个字“Game On.”,也有观点认为这对AI视频创业公司来说可能意味着game over。对此,你怎么看?
我觉得要看商业化推出的速度,不管目前技术多强,如果有其他公司做出了水平差不多的应用,并且在sora之前上线,未必会输,毕竟商业化才是最后一步,很多起个大早赶了个晚集的案例。
就这几天,就有很多专业人士推导出了Sora的核心算法,甚至已经开始进行复现工作了,这个行业竞争很激烈,执行能力强的团队甚至有后来居上的可能。
我站在他们角度想,这种差距应该是让人很痛苦的。但我也问过PixVerse的人,他们给的回答比较乐观,就是说至少方向是对的,证明这条路是通的。
这个世界是分化的。现在不太可能会出现一个一家独大的东西了。现在你只要在这个牌桌上,只要技术还能说出来亮点,就有存活空间。这两天最好的一个例子是ElevenLabs,他们瞄准的是open AI看不上的音效。
而且我认为Sora不是OpenAI用来打Pika或者Runway的,他们花这么大精力做,不会是仅仅为了视频行业这个市场,Sora只是OpenAI用来训练其世界大模型的视频版的。
AI发展到今天这一步已经完全不能用人类过去的经验来进行预测判断了,也没有人敢下判断未来会出现什么样的格局,但我个人感觉其他视频生成模型公司跑出来的难度非常非常大,同理可参见LLM,自从OpenAI变成“ClosedAI”之后,竞争对手们的进展确实非常慢。
虽说视频生成通用大模型基础之上很多未来可能的细分场景都还是有深耕的机会在,但对模型厂商来说,这个机会一定是在其模型能力至少能达到Sora能力60%以上的情况下才会存在。而在Sora还在迭代且算法、数据细节都没有公开的情况下,想赶上还是很有难度的。(说不定OpenAI的那篇报告里还有坑)。
虽然Sora效果很惊艳,但值得我们注意的是,Sora生成视频所需要的算力成本和时间都没有作详细说明,如果Sora的使用性价比非常低的话,其他厂商们就都还有希望。
期待大家都能迎头赶上,尤其是国内的厂商们,毕竟只有OpenAI一家的AGI必定是昂贵的。
当然是Game On了,如果现在都game over了,那也太没有想象力了。对于影视行业来说,我们希望AI视频行业越卷越好,卷出成本更低的,时间更长的,质量更好的,对我们来说就更有价值。
这几天关于sora的讨论不断在发酵,围绕sora还有什么问题是你很关心的?
什么时候上线?价格怎样?实际可控部分有多少?
我想看Sora真的放出来是什么情况。我觉得应该不会是60秒的长度,现在的showcase都是拿出最好的秀肌肉,可能是有融资需求。但是这背后算力成本是巨大的,可能目前没法给公众开放。
1. Sora 能不能开源?
2. 如何避免 AI 视频里可能会带来的刻板印象问题?
3. 国内 AI 视频如何跟进?
IP issue一直是生成式AI巨大的争议点。我特别关心Sora的数据来源。
最关心的是,我们国产的什么时候能出来。
(以上优尼孔为化名,头像为虚拟头像)
-
阅读原文
* 文章为作者独立观点,不代表数艺网立场转载须知
- 本文内容由数艺网收录采集自微信公众号东西文娱 ,并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 如您不希望被数艺网所收录,感觉到侵犯到了您的权益,请及时告知数艺网,我们表示诚挚的歉意,并及时处理或删除。