资讯
展览资讯 大型展会 灯光节 大型盛典 赛事 中标捷报 产品快讯 热门话题 艺术节 活动 演出 新闻 数艺报道 俱乐部签约
观点
大咖专访 观点洞察 书籍推荐 吐槽 设计观点 企业访谈 问答 趋势创新 论文 职场方法 薪资报价 数艺专访
幕后
幕后故事 团队访谈 经验分享 解密 评测 数艺访谈
干货
设计方案 策划方案 素材资源 教程 文案资源 PPT下载 入门宝典 作品合集 产品手册 电子书 项目对接
  • 0
  • 0
  • 1

分享

4个月狂揽两千万,国内首个披露营收的大模型来了!

2023-09-01



  新智元报道  

编辑:编辑部
【新智元导读】稳居国内第一梯队的360智脑,已经开始赚钱了!根据360的2023年半年报,360智脑已创造近2000万元相关业务收入,成为国内首个披露实现营收的大模型产品。

年初打得如火如荼的「百模大战」,终于有了阶段性的战果。
8月31日,10余家大模型陆续通过《生成式人工智能服务管理暂行办法》备案,最终获批向公众开放。360智脑也已首批完成备案提交,预计将在未来1周左右陆续由各地方管理部门对外披露。
而与之同时展开的,就是各个大厂的疯狂扩招。
现在,全球都在疯抢AI人才。领英数据显示,全球AI技术岗的招聘需求,已经比半年前激增21倍!

几个月来,Indeed上与生成式AI相关的职位大幅上升
在美国,顶尖人才可以拿到的薪水,已经接近七位数。
在线约会平台Hinge给AI副总裁开的年薪,高达398,900美元。Upwork的AI和机器学习副总裁,年薪高达437,000美元。亚马逊的AI高级经理,薪水为340,300美元。
而在国内,大模型的头部玩家——百度,阿里和360集团,也开始了「抢人大战」。
360创始人周鸿祎,更是直接在自己的微博上招人,希望「有批判精神,有想象力的奇才怪杰」能投奔自己麾下。

权威评测,4项能力超越GPT-4

不过,这只是大模型产品迈向成功的「万里长征第一步」。
产品好不好用,能否有效满足客户需求,能够为社会创造多大价值,更关键的还是要看各个大模型的性能,以及各个公司的产品工程能力。
用户在面对未来市面上可能会出现的几十家模型,如何对比大模型产品的性能,从而做出一个最适合自己的选择,最客观有效的方法,还是要关注各家模型的「跑分」情况。
C-EVAL作为国内目前最权威的大模型中文能力评测,几乎囊括了所有国内外的主流模型。由上交,清华,爱丁堡大学共同推出。
C-EVAL包括人文、社科、理工、其他专业四个大方向,52个学科(含微积分、线代等),涵盖初中、高中、大学、职业四个难度级别,共计13948道试题。
为了确保大学科目的全面性,C-EVAL从教育部列出的13个官方本科专业中,选取了25个代表性科目,其中每个专业类别至少包含一个。
而在专业层面上,它参考了官方的国家职业资格目录5,选择了12个代表性科目,如如医学、法律和公务员考试,分为四类——STEM(科学、技术、工程和数学)、社会科学、人文学科和其他领域。
作为驱动360智脑的大模型360GPT-S2,在C-EVAL中排名第五,平均分超过了GPT-4。

测试地址:https://cevalbenchmark.com/static/leaderboard.html
具体来看,360GPT在社会科学类问题上的表现十分突出,凭借着82分的好成绩位列第三。

社会科学
而在人文科学方面,360GPT也获得了70.6的分数,高于GPT-4的64.5分。
相比之下,GPT-4只拿到了77.6分,和国产模型有一定差距。

人文科学
360GPT能够表现如此出色的原因在于,它在预训练时采用了高质量、多样性的语料。
如果想训练出强大的大语言模型,就需要依托充足的高质量数据。数据的数量、质量、多样性乃至清洗能力,都是影响大模型性能的关键要素。
而360搜索的优势恰恰在此。经过11年多的积累,360搜索已经积累了上万亿网页,以及完善的数据过滤和清洗手段。
在语料处理方面,360采用了低质站点过滤、噪音清洗、多维度去重、基于统计的ngram语言模型过滤、基于标注结果训练的fastText模型过滤等常规数据处理手段。
不仅如此,360还将语料处理结合到了大模型的训练过程中,基于多个benchmark和自有的下游评估数据上few-shot的结果,不断指导预训练数据的清洗。
而在预训练语料的配比上,360考虑了类似谷歌DoReMi的大模型数据配比采样方法,并且还针对自有文库、问答、题库等高质量数据集进行了重采样。
这样,模型就能更深刻地融入知识,推理解题学习过程大大增强。
最终的结果,就是360GPT-S2在下游任务上的惊艳表现。

360智脑4.0,最新体验效果拔群

据了解,360的自研认知型通用大模型——360智脑,目前已升级至4.0版本。
自7月以来,360智脑的整体性能已经提升14.55%,COT能力提升69%,逻辑推理能力大升级,甚至实现了50000+字的更长文本输入,多轮对话长度提升了18%。
同时,360发布的企业级AI大模型解决方案,已经为近20个行业提供解答。
在今年8月,360还发布了国内首个可交付的安全行业大模型——「360安全大模型」,安全攻防判断准确率超96%。
打开如今的360智脑页面,可以看到它比起5月份时的界面,已经焕然一新。
对话角色除了360智脑之外,还有了马斯克、诸葛亮、孙悟空、林黛玉等数字人。
并且,你还可以创建自己的数字人。
现在,在360的数字人广场上,已经充满了用户们生成的各类娱乐、历史、小说人物,甚至还有帮忙写文案、做视频、写营销策划的数字助手。
其中,最有那味儿的还得是马老板,上来第一句话就是「你在浪费我的时间」!
尤其是在开启沉浸对话模式之后,360智脑不仅会用语音念出生成的文字,而且人物的头像也会跟着一起「张嘴说话」。
对于自己要去火星的计划,他解释道,自己的目的是让人类成为多行星物种。
但被问到何时和小扎角斗时,他却忽然谦虚地打起了哈哈。
或者,尝试问一问爱因斯坦,人工智能会不会超过人类智能?
他表示,并不排除人类开发出具有自我意识AI的可能,但在可预见的未来似乎不太可能发生。
找刘备问了个比较刁钻的问题,想不到他的回答还真的和他的人设非常契合。
既不得罪一方,还让你挑不出毛病,看来360智脑是真的懂刘备的!
再比如,我们还可以向王阳明提问:思想家是否也有自我怀疑的时刻?
除了琳琅满目的数字人,360智脑在给打工人提供帮助的各项功能上,也更丝滑了。
比如扮演PPT高手,做出特定主题的PPT提纲。
比如用列表的方式,总计10个关于量子力学知识的重点。
还能解释代码,说明它的功能、算法和执行逻辑。
比如,输入一段快速排序的C语言代码实现。
对于这道题,360智脑不仅给出了详尽的解释,而且还自己「发散」出了一些更加深入的问题,可以帮助我们更好地理解并学习相关的知识。
其实,360大模型作为国内首个能联网的大模型,在今年5月底交卷时就带给我们不小的惊喜。
作为360自研认知型通用大模型,360智脑背后依托的,正是360多年积累的大算力、大数据、工程化,而这些,全是360的关键优势。
360智脑集成了360GPT大模型、360CV大模型、360多模态大模型技术能力,具备生成与创作、代码能力、逻辑与推理、多模态等十大核心能力,还有数百项细分功能。
今年6月,360智脑成为全国首个通过工信部信通院认证的「可信AIGC大模型」。360智脑在10部分36项基础能力评估中全部通过。
今年8月,新华社研究员发布了《人工智能大模型体验报告2.0》,360智脑在基础能力方面稳居前列。
报告中,360智脑「展现了大模型强大的实时搜索与回复能力」,多个题目的回答被报告援引为最佳案例。特别是在回答时效性问题上,360智脑表现优异。

汇集顶尖人才,研发半年投入15.6亿

从各项实测的结果中不难看出,360GPT在理解力和推理力着实表现不俗。
而不断蝶变创新背后,是360深厚的技术实力。
- 数据语料
众所周知,大模型若想成功,离不开大量的语料数据。用什么样的数据训练模型,直接决定了模型的知识能力。
凭借自身的搜索引擎,360每天可以从互联网抓取大量的数据。经过处理之后,这些稀有、优质和安全的训练语料,也为大模型的研发带来了极大的优势。
- 工程能力
凭借为全球200多个国家15亿用户提供持续服务的技术和工程方面积累,360具备了世界级互联网产品的工程研发能力。
同样,在大模型方面,360也积累了完整的算力,框架,平台搭建能力。其中的大模型训练和推的工程能力,更是位居全国前列。
- 应用场景
在流量入口上,360也拥有全行业领先的场景优势。
中国第一大浏览器360浏览器,中国第一大PC安全产品360安全卫士和全国第二大的搜索引擎360搜索,这些流量积累让360未来的AI产品能「站在巨人的肩膀上」完成启动。
与此同时,这些产品的人工智能化也会进一步提升用户的使用体验,迭代出更好的产品。
而360比肩微软的全端应用,搜索引擎,移动办公,游戏等业务提供了丰富的AI场景支撑和用户实时反馈渠道,能为将来大模型的商业化实践和优化打下了坚实的基础。
- 大模型安全
除此之外,360在AI算法、框架、应用、伦理等涉及到AI安全领域的研究上,也处于全国领先的位置。
其首创大模型安全风险评估体系「AISE」,甚至还参与到了国家级AI开放平台的搭建当中。
这些成绩的背后,离不开360长期以来的科研投入和人才储备。
一方面,360在数字安全、人工智能等领域始终保持高研发投入占比,仅2023年上半年,公司研发投入15.6亿元。
另一方面,360汇集了国内AI行业的顶尖人才。其中,360智脑的算法团队由360人工智能研究院和360搜索团队共同组成,分为预训练、微调、对齐、Code、数据、模型应用共6个小组。
早在2015年,360就成立了人工智能研究院。
经过接近10年的发展,360人工智能研究院具备了国内领先的技术研发和创新能力。
除了在大模型核心算法体系中有着多年的积累外,360还在自然语言理解,机器视觉与运动,多模态大语言模型等领域都处于行业领先的地位。
不论是360发布的大模型在各个榜单中取得的优异成绩,还是360人工智能研究院的成果在知识图谱,多模态,图像等方向多次获得业内顶级赛事的冠军/提名奖项,都展示了360深厚的团队和技术积累。
2022年,360人工智能研究院开源了国内首个中文高质量图文对数据集。
同时,还提出了多模态预训练框架R2D2,采用pre-Ranking + Ranking策略来学习视觉语言表示,以及two-way蒸馏方法来进一步增强学习能力,大幅刷新了当时的SOTA结果。
周鸿祎介绍,360通过「两翼齐飞」的人工智能发展战略,已经在核心技术、场景布局和产品打磨上取得了丰硕的成果。
借助多年在多方位业务场景中的优势,360版GPT能够像「发电厂」一样,把大数据加工成「电」,进而源源不断地赋能千百行业。

阅读原文

* 文章为作者独立观点,不代表数艺网立场转载须知

本文内容由数艺网收录采集自微信公众号新智元 ,并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 如您不希望被数艺网所收录,感觉到侵犯到了您的权益,请及时告知数艺网,我们表示诚挚的歉意,并及时处理或删除。

数字媒体艺术 新媒体艺术 科技艺术

10377 举报
  0
登录| 注册 后参与评论