文章 (22)
-
上下文学习=对比学习?人大揭示ICL推理背后的隐式更新机理:梯度更新了吗?「如更」
2023-11-03
新智元报道 编辑:LRS【新智元导读】人民大学最新研究,首次从「对比学习」的角度来理解上下文学习,或可提供自注意力机制的改进思路。近些年来,基于Transformer的大语言模型表现出了惊人的In-contextLearning(IC
-
清华&通院让AI智能体成功识破谎言!ReCon框架玩转「阿瓦隆」,三思后行+换位思考
2023-10-25
新智元报道 编辑:LRS【新智元导读】让AI智能体学会「三思而后行」和「换位思考」,实现对虚假欺骗信息的甄别与应对,为通用人工智能增加安全屏障。大语言模型(LargeLanguageModels,LLMs)的进展促进了AI智能体(特别
-
34B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%
2023-09-19
新智元报道 编辑:LRS【新智元导读】数学通才「猛犸」模型给开源语言模型带来了「推理春天」,面对GPT-4都有一战之力!数学推理问题是语言模型绕不过的痛点,在各种黑科技的加持下,开源模型的推理性能依然不够看。最近,滑铁卢大学、俄亥俄州
-
LLM变现平台来了!LangChain+DemoGPT合作:有了idea就能挣钱,「只缺程序员」的时代宣告结束
2023-09-19
新智元报道 编辑:LRS【新智元导读】LLM应用开发进入快车道,变现平台已经搭建好,只等一个绝妙创意!有了大型语言模型的加持,开发者可以实现很多全新的功能,适应更广泛的应用场景。甚至LLM本身就具有编码能力,可以把自然语言指令直接转
-
Hold住千亿参数大模型,Gaudi®2 有何优势
2023-09-15
大语言模型的训练和推理对性能和成本带来更大挑战。Habana® Gaudi®2实力亮相本届服贸会,通过demo展示如何加速大模型,优化性价比。
-
超越ToT,苏黎世理工发布新一代思维图GoT:推理质量提升62%,成本降低31%
2023-09-12
新智元报道 编辑:LRS【新智元导读】推理速度、推理质量二者兼得,全新一代思维图GoT可以处理更复杂推理任务!大型语言模型在推理上仍然是弱势项目,需要依赖各种思维工具辅助完善推理过程。最近,苏黎世联邦理工大学、华沙理工大学的研究人员共
-
李云龙、谢耳朵专业陪聊!角色扮演系统ChatHaruhi爆火:支持32个中外角色,开源5.4万条对话数据
2023-09-12
新智元报道 编辑:LRS【新智元导读】GitHub斩获700+stars,除了二次元角色,ChatHaruhi还支持《武林外传》、《亮剑》、《生活大爆炸》、于谦等经典角色!「角色扮演」是大型语言模型众多应用场景中比较有意思的,LLM可
-
GPT-4 MATH准确率最高涨至84.3%!港中文、清华等七所顶尖高校提出全新CSV方法
2023-09-01
新智元报道 编辑:LRS【新智元导读】让模型用代码自我验证解决方案,结合多数投票集成机制,推理准确率可以提升近30%!虽然大型语言模型(LLMs)在常识理解、代码生成等任务中都取得了非常大的进展,不过在数学推理任务上仍然存在很大改进空