微软论文一张截图，曝出GPT-3.5仅有200亿参数？AI圈巨震，网友大呼太离谱！-数艺网

资讯: 展览资讯大型展会灯光节大型盛典赛事中标捷报产品快讯热门话题艺术节活动演出新闻数艺报道俱乐部签约

观点: 大咖专访观点洞察书籍推荐吐槽设计观点企业访谈问答趋势创新论文职场方法薪资报价数艺专访

幕后: 幕后故事团队访谈经验分享解密评测数艺访谈

干货: 设计方案策划方案素材资源教程文案资源 PPT下载入门宝典作品合集产品手册电子书项目对接

0
0
0

分享

微软论文一张截图，曝出GPT-3.5仅有200亿参数？AI圈巨震，网友大呼太离谱！: 2023-10-31

新智元报道

编辑：编辑部

【新智元导读】微软最近一篇论文爆料，GPT-3.5的参数量只有20B，远远小于之前GPT-3公布175B。网友表示，ChatGPT能力似乎「配得上」这个体量？

GPT-3.5只有200亿参数？

今天，大模型圈都被微软论文中的一纸截图刷爆了，究竟是怎么回事？

就在前几天，微软发表了篇论文并挂在了arXiv上，该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusion。

性能方面，7500万参数的CodeFusion在top-1准确率指标上，可以与最先进的350M-175B模型相媲美。

论文地址：https://arxiv.org/abs/2310.17680

这篇论文的工作很有意义，但引起大家格外注意的却是——

作者在对比ChatGPT（gpt-3.5-turbo）时，标称的参数量竟然只有20B！

在此之前，大家针对GPT-3.5参数量的猜测都是1750亿，这相当于是缩减了差不多十倍！

根据这篇论文的爆料，网友还去维基百科上更新了GPT-3.5的介绍，直接把参数大小改成了20B。

消息一出，直接登上知乎热搜，网友们都炸了。

有人表示，赶紧回头再把我之前模型蒸馏的博文拿出来复习复习。

是「乌龙」还是「事实」？

网友的爆料贴一出，瞬间就引发了激烈的讨论。

目前，已经有超过68万人前来围观。

这位老哥表示，论文的几位作者也都在用推特，估计过不了多久就会亲自下场解释。

而对于这个神秘的「20B」，网友们也是众说纷纭。

有人猜测，这很可能是作者手误打错了。比如原本是120B，或者200B。

结合现实中的各项评测来看，确实有很多小模型能够取得和ChatGPT差不多的成绩，比如Mistral-7B。

也许，这也是侧面证实了GPT-3.5体量真的不大。

很多网友也认为20B的参数可能是准确的，纷纷发出感叹：

「这也太难以想象了！Falcon-180B和Llama2-70B，竟然都无法击败这款20B的模型。」

也有网友认为，gpt-3.5-turbo是精炼版的gpt-3.5。

而这次参数的「泄露」，正好从侧面印证了那些关于gpt-3.5-turbo表现不如旧版gpt-3.5的传言。

不过，根据OpenAI的官方文档，除了已经不再使用的text-davinci和code-davinci，GPT-3.5家族全员都是基于gpt-3.5-turbo构成的。

微软发布CodeFusion

而爆出GPT3.5只有20B参数的微软论文，是想介绍一个用于代码生成的扩散模型。

研究人员针对Bash、Python和Microsoft Excel条件格式（CF）规则的自然语言生成代码的任务来评估这个模型——CodeFusion。

实验表明，CodeFusion（只有75M参数）在top-1精度方面与最先进的LLM（350M-175B参数）相当，并且在top-3和top-5精度方面性能和参数比非常优秀。

模型架构

CODEFUSION用于代码生成任务，它的训练分为两个阶段，第一阶段是无监督预训练，第二阶段是有监督微调。

在第一阶段，CODEFUSION使用未标记的代码片段来训练降噪器和解码器。它还使用可训练的嵌入层L，将代码片段嵌入到连续空间中。

在第二阶段，CODEFUSION进行有监督的微调，使用来自文本-代码对数据。在这个阶段，编码器、降噪器和解码器都会得到调整，以更好地执行任务。

此外，CODEFUSION还借鉴了之前有关文本扩散的研究成果，将来自解码器的隐藏表示D融合到模型中。这是为了改进模型的性能。在训练过程中，在不同step中，模型引入一些噪声，然后计算损失函数，以确保生成的代码片段更符合预期的标准。

总之，CODEFUSION是一个执行代码生成工作的小模型，通过两个阶段的训练和噪声引入来不断提升其性能。这个模型的灵感来自于文本扩散的研究，并通过融合解码器的隐藏表示来改进损失函数，以更好地生成高质量的代码片段。

评估结果

下表总结了CODEFUSION模型与各个基线模型在top-1、top-3和top-5设置下的性能表现。

在top-1中，CODEFUSION的性能与自回归模型相媲美，甚至在某些情况下表现更出色，尤其是在Python任务中，只有GPT-3（175B）的性能稍微优于CODEFUSION（75M）。然而，在top-3和top-5方面，CODEFUSION明显优于所有基线模型。

表下表展示了CODEFUSION和自回归模型（包括T5、CodeT5、StarCoder、CodeGen、GPT-3）在各项基准任务上的平均多样性结果，考察了每个模型的前5代生成结果。

相对于自回归模型，CODEFUSION生成更加多样化的结果，表现更出色。

在消融实验中，作者停止了去噪过程，并生成了在时间步t∈[0, T]范围内的当前状态的代码片段。利用归一化字符串编辑距离来衡量每个时间步长（每100步为一个增量）所获得的结果。

这一方法有助于总结和展示CODEFUSION模型的逐步进展，如下图所示。

说了这么多，GPT-3.5的参数量到底是多少？GPT-4与GPT-3.5在技术和其他方面有着什么样的联系？

GPT-3.5是一个个小专家模型的集成还是一个通才模型？是通过更大模型的蒸馏还是更大数据训练？

这些问题的答案只能等到真正开源的时候才能揭晓了。

阅读原文 * 文章为作者独立观点，不代表数艺网立场转载须知: 本文内容由数艺网收录采集自微信公众号新智元 ，并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源：数艺网” 并附上本页链接：如您不希望被数艺网所收录，感觉到侵犯到了您的权益，请及时告知数艺网，我们表示诚挚的歉意，并及时处理或删除。

数字媒体艺术新媒体艺术科技艺术

12756

0

评论 (0)

登录| 注册后参与评论

北京

甲方 · 媒体平台

未认证的机构号

+关注认领

recently released

查看更多

Related articles

您确定认领此案例

数艺网是一个信息获取、分享及传播的平台，我们尊重和鼓励数艺网用户创作的内容，认识到保护知识产权对数艺网生存与发展的重要性，承诺将保护知识产权作为数艺网运营的基本原则之一。

本条款原则如下：

1. 用户在数艺网上发表的全部原创内容（包括但不仅限于文章、案例/项目和评论），著作权均归用户本人所有。用户可授权第三方以任何方式使用，不需要得到数艺网的同意。

2. 数艺网上可由多人参与编辑的内容，包括但不限于案例/作品的认领、企业/机构的认领，所有参与编辑者均同意，相关知识产权归数艺网所有。

3. 数艺网提供的网络服务中包含的标识、版面设计、排版方式、文本、图片、图形等均受著作权、商标权及其它法律保护，未经相关权利人（含数艺网及其他原始权利人）同意，上述内容均不得在任何平台被直接或间接发布、使用、出于发布或使用目的的改写或再发行，或被用于其他任何商业目的。

4. 为了促进知识的分享和传播，用户将其在数艺网上发表的全部内容，授予数艺网免费的、不可撤销的、非独家使用许可，数艺网有权将该内容用于数艺网各种形态的产品和服务上，包括但不限于网站以及发表的应用或其他互联网产品。

5. 第三方若出于非商业目的，将用户在数艺网上发表的内容转载在数艺网之外的地方，应当在作品的正文开头的显著位置注明原作者姓名（或原作者在数艺网上使用的帐号名称），给出原始链接，注明「发表于数艺网」，并不得对作品进行修改演绎。若需要对作品进行修改，或用于商业目的，第三方应当联系用户获得单独授权，按照用户规定的方式使用该内容。

6. 数艺网为用户提供「保留所有权利，禁止转载」的选项。除非获得原作者的单独授权，任何第三方不得转载标注了「禁止转载」的内容，否则均视为侵权。

7. 在数艺网上传或发表的内容，用户应保证其为著作权人或已取得合法授权，并且该内容不会侵犯任何第三方的合法权益。如果第三方提出关于著作权的异议，数艺网有权根据实际情况删除相关的内容，且有权追究用户的法律责任。给数艺网或任何第三方造成损失的，用户应负责全额赔偿。

8. 如果任何第三方侵犯了数艺网用户相关的权利，用户同意授权数艺网或其指定的代理人代表数艺网自身或用户对该第三方提出警告、投诉、发起行政执法、诉讼、进行上诉，或谈判和解，并且用户同意在数艺网认为必要的情况下参与共同维权。

9. 数艺网有权但无义务对用户发布的内容进行审核，有权根据相关证据结合《侵权责任法》、《信息网络传播权保护条例》等法律法规及数艺网社区管理规定对侵权信息进行处理。

侵权举报

1.处理原则

数艺网作为新媒体艺术领域的分享交流平台，高度重视自由表达和个人、机构正当权利的平衡。依照法律规定删除违法信息是数艺网社区的法定义务，数艺网社区亦未与任何中介机构合作开展此项业务。

2.受理范围

受理数艺网社区内侵犯机构或个人合法权益的侵权举报，包括但不限于涉及个人隐私、造谣与诽谤、商业侵权。

a.涉及个人隐私：发布内容中直接涉及身份信息，如个人姓名、家庭住址、身份证号码、工作单位、私人电话等详细个人隐私；

b.造谣、诽谤：发布内容中指名道姓（包括自然人和机构）的直接谩骂、侮辱、虚构中伤、恶意诽谤等；

c.商业侵权：泄露机构商业机密及其他根据保密协议不能公开讨论的内容。

3.举报条件

用户在数艺网发表的内容仅表明其个人的立场和观点，并不代表数艺网的立场或观点。如果个人或机构发现数艺网上存在侵犯自身合法权益的内容，可以先尝试与作者取得联系，通过沟通协商解决问题。如您无法联系到作者，或无法通过与作者沟通解决问题，您可通过点击内容下方的举报按钮来向数艺网平台进行投诉。为了保证问题能够及时有效地处理，请务必提交真实有效、完整清晰的材料，否则投诉将无法受理。您需要向数艺网提供的投诉材料包括：

a. 权利人对涉嫌侵权内容拥有商标权、著作权和/或其他依法可以行使权利的权属证明，权属证明通常是营业执照或组织机构代码证；

b. 完整填写的通知书；附供下载的：侵权投诉通知书；

c. 举报人的身份证明，身份证明可以是身份证或护照；

d. 如果举报人非权利人，请举报人提供代表权利人进行举报的书面授权证明。

e. 为确保投诉材料的真实性，在侵权举报中，您还需要签署以下法律声明：

(1) 我本人为所举报内容的合法权利人；

(2) 我举报的发布在数艺网社区中的内容侵犯了本人相应的合法权益；

(3) 如果本侵权举报内容不完全属实，本人将承担由此产生的一切法律责任，并承担和赔偿数艺网因根据投诉人的通知书对相关帐号的处理而造成的任何损失，包括但不限于知乎因向被投诉方赔偿而产生的损失及数艺网名誉、商誉损害等。

4.处理流程

出于网络平台的监督属性，并非所有申请都必须受理。数艺网自收到举报的七个工作日内处理完毕并给出回复。处理期间，不提供任何电话、邮件及其他方式的查询服务。出现数艺网已经删除或处理的内容，但是百度、谷歌等搜索引擎依然可以搜索到的现象，是因为百度、谷歌等搜索引擎自带缓存，此类问题数艺网无权也无法处理，因此相关申请不予受理。您可以自行联系搜索引擎服务商进行处理。此为数艺网社区唯一的官方侵权投诉渠道，暂不提供其他方式处理此业务。用户在数艺网中的商业行为引发的法律纠纷，由交易双方自行处理，与数艺网无关。

免责申明

1.数艺网不能对用户发表的回答或评论的正确性进行保证。

2.用户在数艺网发表的内容仅表明其个人的立场和观点，并不代表数艺网的立场或观点。作为内容的发表者，需自行对所发表内容负责，因所发表内容引发的一切纠纷，由该内容的发表者承担全部法律及连带责任。数艺网不承担任何法律及连带责任。

3.数艺网不保证网络服务一定能满足用户的要求，也不保证网络服务不会中断，对网络服务的及时性、安全性、准确性也都不作保证。

4.对于因不可抗力或数艺网不能控制的原因造成的网络服务中断或其它缺陷，数艺网不承担任何责任，但将尽力减少因此而给用户造成的损失和影响。

协议修改

1.根据互联网的发展和有关法律、法规及规范性文件的变化，或者因业务发展需要，数艺网有权对本协议的条款作出修改或变更，一旦本协议的内容发生变动，数艺网将会直接在数艺网网站上公布修改之后的协议内容，该公布行为视为数艺网已经通知用户修改内容。数艺网也可采用电子邮件或私信的传送方式，提示用户协议条款的修改、服务变更、或其它重要事项。

2.如果不同意数艺网对本协议相关条款所做的修改，用户有权并应当停止使用数艺网。如果用户继续使用数艺网，则视为用户接受数艺网对本协议相关条款所做的修改。

阅读并同意此认领协议方可认领案例