数艺网

文章 (13)

8张3090，1天压缩万亿参数大模型！3.2TB骤降至160GB，压缩率高达20倍

2023-10-31

新智元报道编辑：好困【新智元导读】最近，来自ISTA的研究人员提出了一种全新的模型量化方法QMoE，可以将1.6万亿个参数的SwitchTransformer压缩到160GB以下（每个参数0.8位），且精度损失很小。随着GPT-4的

新智元

11433
34B参数量超越GPT-4！「数学通用大模型」MAmmoTH开源：平均准确率最高提升29%

2023-09-19

新智元报道编辑：LRS【新智元导读】数学通才「猛犸」模型给开源语言模型带来了「推理春天」，面对GPT-4都有一战之力！数学推理问题是语言模型绕不过的痛点，在各种黑科技的加持下，开源模型的推理性能依然不够看。最近，滑铁卢大学、俄亥俄州

新智元

12314
GPT-5正秘密训练！DeepMind联创爆料，这模型比GPT-4大100倍

2023-09-03

新智元报道编辑：润桃子【新智元导读】GPT-5仍在秘密训练中！DeepMind联合创始人在近日采访中透露，未来3年，Inflection模型要比现在的GPT-4大1000倍。近来，DeepMind联合创始人MustafaSuleym

新智元

11343
GPT-4 MATH准确率最高涨至84.3%！港中文、清华等七所顶尖高校提出全新CSV方法

2023-09-01

新智元报道编辑：LRS【新智元导读】让模型用代码自我验证解决方案，结合多数投票集成机制，推理准确率可以提升近30%！虽然大型语言模型（LLMs）在常识理解、代码生成等任务中都取得了非常大的进展，不过在数学推理任务上仍然存在很大改进空

新智元

10661
GPT-4推理提升1750%！普林斯顿清华姚班校友提出全新「思维树ToT」框架，让LLM反复思考

2023-05-22

新智元报道编辑：桃子好困【新智元导读】由普林斯顿和谷歌DeepMind联合提出的全新「思维树」框架，让GPT-4可以自己提案、评估和决策，推理能力最高可提升1750%。2022年，前谷歌大脑华人科学家JasonWei在一篇思维链的开

新智元

10982
科学家也要失业了？AI成为主脑科学家，AI主导的科学革命已来

2023-05-22

新智元报道编辑：LRS好困【新智元导读】GPT-4有能力在一个完整的自然科学闭环测试研究中，作为主脑科学家，占据科研的中心地位；而人类作为助手，居于从属地位。未来，我们有望期待进入「AI驱动的科学纪元」（AI-drivenScien

新智元

11678
AI「黑箱」被打开？谷歌找到大模型能力涌现机制

2023-05-21

新智元报道编辑：桃子【新智元导读】大模型涌现能力如何理解？谷歌的最新论文研究了语言模型中的上下文学习，是如何受到语义先验和输入-标签映射影响。前段时间，OpenAI整出了神操作，竟让GPT-4去解释GPT-2的行为。对于大型语言模型

新智元

11725
训练成本不到1000元，直降90%！NUS、清华发布VPGTrans：轻松定制类GPT-4多模态大模型

2023-05-19

新智元报道编辑：LRS好困【新智元导读】最近的多模态（对话）大模型将基于文本的ChatGPT的强大能力扩展到了多模态输入，实现强大的多模态语义理解，比如GPT-4、BLIP-2、Flamingo等。但咱们普通玩家训练一个多模态GPT

新智元

10400

热门推荐

猜你喜欢

搜索记录

文章 (13)

8张3090，1天压缩万亿参数大模型！3.2TB骤降至160GB，压缩率高达20倍

新智元报道编辑：好困【新智元导读】最近，来自ISTA的研究人员提出了一种全新的模型量化方法QMoE，可以将1.6万亿个参数的SwitchTransformer压缩到160GB以下（每个参数0.8位），且精度损失很小。随着GPT-4的

34B参数量超越GPT-4！「数学通用大模型」MAmmoTH开源：平均准确率最高提升29%

GPT-5正秘密训练！DeepMind联创爆料，这模型比GPT-4大100倍

新智元报道编辑：润桃子【新智元导读】GPT-5仍在秘密训练中！DeepMind联合创始人在近日采访中透露，未来3年，Inflection模型要比现在的GPT-4大1000倍。近来，DeepMind联合创始人MustafaSuleym

GPT-4 MATH准确率最高涨至84.3%！港中文、清华等七所顶尖高校提出全新CSV方法

GPT-4推理提升1750%！普林斯顿清华姚班校友提出全新「思维树ToT」框架，让LLM反复思考

新智元报道编辑：桃子好困【新智元导读】由普林斯顿和谷歌DeepMind联合提出的全新「思维树」框架，让GPT-4可以自己提案、评估和决策，推理能力最高可提升1750%。2022年，前谷歌大脑华人科学家JasonWei在一篇思维链的开

科学家也要失业了？AI成为主脑科学家，AI主导的科学革命已来

新智元报道编辑：LRS好困【新智元导读】GPT-4有能力在一个完整的自然科学闭环测试研究中，作为主脑科学家，占据科研的中心地位；而人类作为助手，居于从属地位。未来，我们有望期待进入「AI驱动的科学纪元」（AI-drivenScien

AI「黑箱」被打开？谷歌找到大模型能力涌现机制

训练成本不到1000元，直降90%！NUS、清华发布VPGTrans：轻松定制类GPT-4多模态大模型

新智元报道编辑：LRS好困【新智元导读】最近的多模态（对话）大模型将基于文本的ChatGPT的强大能力扩展到了多模态输入，实现强大的多模态语义理解，比如GPT-4、BLIP-2、Flamingo等。但咱们普通玩家训练一个多模态GPT

热门推荐

猜你喜欢

搜索记录

搜索记录

猜你喜欢

文章 (13)

新智元报道 编辑：好困【新智元导读】最近，来自ISTA的研究人员提出了一种全新的模型量化方法QMoE，可以将1.6万亿个参数的SwitchTransformer压缩到160GB以下（每个参数0.8位），且精度损失很小。随着GPT-4的

新智元报道 编辑：润桃子【新智元导读】GPT-5仍在秘密训练中！DeepMind联合创始人在近日采访中透露，未来3年，Inflection模型要比现在的GPT-4大1000倍。近来，DeepMind联合创始人MustafaSuleym

新智元报道 编辑：桃子好困【新智元导读】由普林斯顿和谷歌DeepMind联合提出的全新「思维树」框架，让GPT-4可以自己提案、评估和决策，推理能力最高可提升1750%。2022年，前谷歌大脑华人科学家JasonWei在一篇思维链的开

新智元报道 编辑：LRS好困【新智元导读】最近的多模态（对话）大模型将基于文本的ChatGPT的强大能力扩展到了多模态输入，实现强大的多模态语义理解，比如GPT-4、BLIP-2、Flamingo等。但咱们普通玩家训练一个多模态GPT

新智元报道编辑：好困【新智元导读】最近，来自ISTA的研究人员提出了一种全新的模型量化方法QMoE，可以将1.6万亿个参数的SwitchTransformer压缩到160GB以下（每个参数0.8位），且精度损失很小。随着GPT-4的

新智元报道编辑：润桃子【新智元导读】GPT-5仍在秘密训练中！DeepMind联合创始人在近日采访中透露，未来3年，Inflection模型要比现在的GPT-4大1000倍。近来，DeepMind联合创始人MustafaSuleym

新智元报道编辑：桃子好困【新智元导读】由普林斯顿和谷歌DeepMind联合提出的全新「思维树」框架，让GPT-4可以自己提案、评估和决策，推理能力最高可提升1750%。2022年，前谷歌大脑华人科学家JasonWei在一篇思维链的开

新智元报道编辑：LRS好困【新智元导读】最近的多模态（对话）大模型将基于文本的ChatGPT的强大能力扩展到了多模态输入，实现强大的多模态语义理解，比如GPT-4、BLIP-2、Flamingo等。但咱们普通玩家训练一个多模态GPT