文章 (13)
-
8张3090,1天压缩万亿参数大模型!3.2TB骤降至160GB,压缩率高达20倍
2023-10-31
新智元报道 编辑:好困【新智元导读】最近,来自ISTA的研究人员提出了一种全新的模型量化方法QMoE,可以将1.6万亿个参数的SwitchTransformer压缩到160GB以下(每个参数0.8位),且精度损失很小。随着GPT-4的
-
34B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%
2023-09-19
新智元报道 编辑:LRS【新智元导读】数学通才「猛犸」模型给开源语言模型带来了「推理春天」,面对GPT-4都有一战之力!数学推理问题是语言模型绕不过的痛点,在各种黑科技的加持下,开源模型的推理性能依然不够看。最近,滑铁卢大学、俄亥俄州
-
GPT-5正秘密训练!DeepMind联创爆料,这模型比GPT-4大100倍
2023-09-03
新智元报道 编辑:润桃子【新智元导读】GPT-5仍在秘密训练中!DeepMind联合创始人在近日采访中透露,未来3年,Inflection模型要比现在的GPT-4大1000倍。近来,DeepMind联合创始人MustafaSuleym
-
GPT-4 MATH准确率最高涨至84.3%!港中文、清华等七所顶尖高校提出全新CSV方法
2023-09-01
新智元报道 编辑:LRS【新智元导读】让模型用代码自我验证解决方案,结合多数投票集成机制,推理准确率可以提升近30%!虽然大型语言模型(LLMs)在常识理解、代码生成等任务中都取得了非常大的进展,不过在数学推理任务上仍然存在很大改进空
-
GPT-4推理提升1750%!普林斯顿清华姚班校友提出全新「思维树ToT」框架,让LLM反复思考
2023-05-22
新智元报道 编辑:桃子好困【新智元导读】由普林斯顿和谷歌DeepMind联合提出的全新「思维树」框架,让GPT-4可以自己提案、评估和决策,推理能力最高可提升1750%。2022年,前谷歌大脑华人科学家JasonWei在一篇思维链的开
-
科学家也要失业了?AI成为主脑科学家,AI主导的科学革命已来
2023-05-22
新智元报道 编辑:LRS好困【新智元导读】GPT-4有能力在一个完整的自然科学闭环测试研究中,作为主脑科学家,占据科研的中心地位;而人类作为助手,居于从属地位。未来,我们有望期待进入「AI驱动的科学纪元」(AI-drivenScien
-
AI「黑箱」被打开?谷歌找到大模型能力涌现机制
2023-05-21
新智元报道 编辑:桃子【新智元导读】大模型涌现能力如何理解?谷歌的最新论文研究了语言模型中的上下文学习,是如何受到语义先验和输入-标签映射影响。前段时间,OpenAI整出了神操作,竟让GPT-4去解释GPT-2的行为。对于大型语言模型
-
训练成本不到1000元,直降90%!NUS、清华发布VPGTrans:轻松定制类GPT-4多模态大模型
2023-05-19
新智元报道 编辑:LRS好困【新智元导读】最近的多模态(对话)大模型将基于文本的ChatGPT的强大能力扩展到了多模态输入,实现强大的多模态语义理解,比如GPT-4、BLIP-2、Flamingo等。但咱们普通玩家训练一个多模态GPT