- 星图比特张炯:低成本专属模型定制训练服务是刚需,未来会走向细分工作流AIGC的产品化
-
原创
2023-04-18
随着以ChatGPT为代表的预训练大模型展现出多产业应用可能性,国内大模型产品接连发布,围绕AIGC的探讨持续升温。作为国内较早获得微软和OpenAI赞助的一家初创公司,星图比特在2022年就顺利接入OpenAI的API。公司目前位于上海漕河泾微软加速器。成立于2015年的星图比特,是一家由上海树图区块链研究院与风语筑(603466.SH)联合投资的原生智能数字内容资产科技公司,主要业务为智能数字资产内容管理。目前,基于率先接入OpenAI API的先发优势,星图比特正为企业和机构提供细分模型定制服务。作为一家目前同时接入OpenAI和部分国产大模型生态的初创公司,星图比特创始人张炯认为,现在到未来半年也是国内大厂的窗口期,虽然短期来说,国内去赶上和超越都很难,但从长期来说的话,国内的应用场景更多,数据生态更加完整,初创公司可能会更有机会。作为国内区块链和生成式AI领域较早的从业者和接触者,张炯曾就职于IBM,长期服务大型金融机构。近期,由张炯主导编写的《一本书读懂AIGC》出版。他在书中提到,新的AI带来的是新的操作系统,这是一个时代的革命,会带来新的流量红利和机会。张炯表示,AI模型可以提供很强的增效能力,并且具备固化自己公司核心业务的优势,未来星图比特的路径是产品化,目前产品正处于研发中。 Q 作为同时接入open AI和国内部分大模型的公司,你怎么看目前国内中文基准的大模型开发难点?第一是工程师,前几年国内的算法工程师基本上都以计算机视觉为主,CV代表的公司有商汤科技和旷视科技。现在很多从业者基本上也都是从CV计算机视觉领域转行而来。NLP跟CV本质上是两个体系,算法训练、模型建模对于CV算法工程师来说,也是一个新的领域,所以人才方面有很大的缺口。第二,国外目前做AI训练最好的GPU商用硬件是英伟达高性能计算的A100、V100。但是A100、V100目前因为中美之间的问题而对国内禁售,国内只能买到A800和V800,它们在训练模型或者说算法的训练效率上来说是只有 A100和V100的1/2和1/3。所以同样的资源,国内硬件在成本消耗上更贵。
第三,训练的数据和语料。中文本身在语料的逻辑上来说不如英文。英文有词根词缀,但中文是象形文字,所以从语法的训练上来说中文难度更大。这也是前段时间百度文心一言的主要的争议点之一。我觉得可以把模型训练当成一个小孩的培养,比如说教学英文,基本上都是先教他3000个单词,然后他的单词认知量在阅读和工作的场景下会提到4000、5000、6000甚至更多。 Q 你怎么看待AIGC的“进化”,对于企业来说应用成本上又会呈现怎样的变动趋势?张炯:进化非常快,一般而言,我比较赞同OpenAI的CEO奥特曼的观点,即从2022年开始AI的迭代周期将遵循新的摩尔定律——基本上AI算力每18个月左右的时间会翻一番。AI的进化速度非常快,但仍受制于硬件的供给。从成本上来说,通用模型在个人用户使用中成本可能会有一定下降,我坚信整个AI研发和运营成本会越来越低,通用大模型也会越来越便宜,但它的降幅是有限的,因为最终它要受制于硬件和电力的成本。对于企业而言,必然会训练自己基于大模型的细分工作流模型,回归正常值的企业投资产出比,才能让AI在企业端长久的被使用。然后可能从1700亿个参数通过算法工程师优化至50亿参数,于是整个模型的运载效率和能耗成本都会大幅度地降低。模型参数越小,运行模型成本就越低。张炯:现在市场需求我觉得处在一个爆发的前期,现在其实也是给了国内这些大厂时间的窗口期,谁先出来谁就会占很大的市场,在未来半年是一个窗口期。模型经过一定时长的训练之后,表现会越来越好。模型表现处在一个爬坡期的过程当中,就会有越来越多的客户去接入。这也是国内纷纷抢先发布的原因。虽然短期来说,国内去赶上和超越都很难,但从长期来说的话,我们的应用场景更多。我们这边的传统互联网的数据化做得更好,然后应用场景更多,长期的表现就放在可能5~10年。我们的表现其实会比他们要来的更强。这一波AI,所有人都站在同一起跑线,对于大家来说,起跑线其实都是一样的,反而一些初创公司可能会更有机会,因为它的适配性更强,更加灵活,然后如果有很强的语料基础,基本上发展就会比较快。张炯:首先我更关注的是可信AI和责任AI,因为现在基于transformer理论体系的 AI产品和应用都是离散式的。它生产出来的内容在很多时候不受人类控制,他可以胡说八道或者去引导人类做一些不该做的事。根本而言,AI没有伦理道德。所以未来基于控制论的可信AI和责任AI这两个理念会更多地被摆上主流技术界的研究和发展方向。其次,商业化层面,因为在目前的AI赛道可能有很多初创公司创业,但是赛道的门槛其实比传统互联网的门槛高,核心点在于公司是否有自己的算法能力,但其实大部分公司只有产品工程能力,所以目前很多公司通过集成应用制作通用平台,但他们本身不具备算法。在商业化的领域,我相信可能在未来的一年或者两年时间会有一批公司倒掉,我也很关心整个行业的可持续发展的问题。 Q 你的团队应该说是国内较早接触ChatGPT的团队之一,当时是在怎样契机下开始对接的?张炯:我们作为一个初创公司,内部80%都是技术人员,剩下20%是公司运营。我们有算法工程师,但没有设计师,所以在业务过程中需要一些内容输出的时候,我们就用算法去解决设计的问题,这对于我们来说会比招个设计师更方便。后面我们就把解决设计问题的思路展现给了微软,并在去年6月份搬到微软加速器办公。在2021年11月份的时候, OpenAI的API在微软云的market上线,那时候他们还缺乏生态,国内对它的关注度也没有那么高。我们可能是国内在2022年11月以前唯一拿到OpenAI API接口的公司。现在申请基本上要排队,直到OpenAI开放账号才能获得使用权。但基本上国内的公司很难排到,因为OpenAI对国内的政策是比较保守的,对国内公司的支持力度没有像对海外公司支持力度这么大,所以就偏弱势,而且目前Open AI在微软云上获得的GPU资源也很紧张,所以对新的账号申请也是分批次开通。所以从2022年11月份、12月份开始,随着AIGC热度骤增,我们开始把AI的能力以业务形式对外输出,因为很多公司有这方面的诉求。 Q 星图比特怎么看 AIGC的应用前景,后续在AIGC上有怎样的规划?张炯:截止3月,星图比特提供的主要服务还是企业端专属模型的定制训练服务。我们从2022年12月份开始推出到现在其实需求量是非常大的,大家都了解到AI模型可以提供很强的增效能力,而且更重要的一点是固化自己公司核心业务的优势。举个例子,比如出版公司或一些泛内容公司,它最大的阻碍是人员流动所带来的内容产出的不稳定性,在公司成本固定的前提下,内容缩水会导致公司营收下降。而基于AI可以很好地把基于传统工作流的能力进行固化,通过模仿原作者内容给这些创作者灵感,从而保证内容作者产出的持续性。因为接触的早,所以很早就对各个模型的能力有了比较深度的了解,之后我们也将根据各个模型的特性再研发我们自己的产品,未来路径肯定是产品化。目前文字处理的应用方向也是我们重点发展的方向,因为NLP自然语言处理是我们公司的在算法这个领域的核心能力。Hello!
我们在为更加闭环、更加高效的服务模式做准备
欢迎加入限定白名单
与我们一起探索
-
阅读原文
* 文章为作者独立观点,不代表数艺网立场转载须知
-
本文内容由数艺网收录采集自微信公众号共同虚拟
,并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网”
并附上本页链接:
如您不希望被数艺网所收录,感觉到侵犯到了您的权益,请及时告知数艺网,我们表示诚挚的歉意,并及时处理或删除。
数字媒体艺术
新媒体艺术
科技艺术
AIGC
ChatGPT
16957
0