- 0
- 0
- 0
分享
- 浅析ChatGPT:历史沿革、应用现状及前景展望
-
2023-02-27
新智元报道
新智元报道
【新智元导读】过去十年来,人工智能技术在持续提高和飞速发展,并不断冲击着人类的认知。
2012年,在ImageNet图像识别挑战赛中,一种神经网络模型(AlexNet)首次展现了明显超越传统方法的能力。 2016年,AlphaGo在围棋这一当时人们认为其复杂性很难被人工智能系统模拟的围棋挑战赛中战胜了世界冠军。 2017年,Google的Ashish Vaswani等人提出了 Transformer 深度学习新模型架构,奠定了当前大模型领域主流的算法架构基础。 2018年,谷歌提出了大规模预训练语言模型 BERT,该模型是基于 Transformer 的双向预训练模型,其模型参数首次超过了3亿(BERT-Large约有3.4个参数); 同年,OpenAI提出了生成式预训练 Transformer 模型——GPT,大大地推动了自然语言处理领域的发展。 2018年,人工智能团队OpenAI Five战胜了世界顶级的Dota 2人类队伍,人工智能在复杂任务领域树立了一个新的里程碑;此后在2018年底,Google DeepMind团队提出的AlphaFold以前所未有的准确度成功预测了人类蛋白质结构,突破了人们对人工智能在生物学领域的应用的想象。 2019年,一种人工智能系统AlphaStar在2019年击败了世界顶级的StarCraft II人类选手,为人工智能在复杂任务领域的未来发展提供了有力的证明和支持。 2020年,随着OpenAI GPT-3模型(模型参数约1750亿)的问世,在众多自然语言处理任务中,人工智能均表现出超过人类平均水平的能力。 2021年1月,Google Brain提出了Switch Transformer模型,以高达1.6万亿的参数量成为史上首个万亿级语言模型;同年12月,谷歌还提出了1.2亿参数的通用稀疏模型GLaM,在多个小样本学习任务的性能超过GPT-3。 2022年2月,人工智能生成内容(AIGC)技术被《MIT Technology Review》评选为2022年全球突破性技术之一。同年8月,Stability AI开源了文字转图像的Stable Diffusion模型。也是在8月,艺术家杰森·艾伦(Jason Allen)利用AI工具制作的绘画作品《太空歌剧院》(Théâtre D’opéra Spatial),荣获美国科罗拉多州艺术博览会艺术竞赛冠军,相关技术于年底入选全球知名期刊《Science》年度科技突破(Breakthrough of the Year 2022)第2名。
舆论及应用现状
扮演医生。它能够推荐常规药物、草药和其他天然替代品。在提供建议时,还可以考虑患者的年龄、生活方式和病史。例如「为患有关节炎的老年患者提出一个侧重于整体治疗方法的治疗计划」。 扮演翻译员。它支持基本上所有常见的语言,可以在一句话中同时包含不同的语种,还可以让它用不同的语言同时进行输出。 扮演办公助手。在金融行业中,它可以帮助银行员工解答客户的问题,同时也可以帮助银行客户快速获得所需信息。它可与PowerPoint、图形程序、数据表和图像编辑程序相连,或者让它自身变为Excel工作表,可以使一切变得更加简单和高效。 程序员。它可以填写电子表单、编写SQL查询并执行,甚至可以根据需求简短地编写Python、Verilog、C++代码,模拟训练网络,模拟Linux系统。有人使用ChatGPT在一晚上的时间创建了一个网站。 历史学家。问武汉为什么叫武汉。ChatGPT可以从武昌、到武陵城、再到每个字的来源进行解释。让它给武汉写一首诗,答:「长江第一城,工业之都,资源丰富;科技先进,人杰地灵,文化显赫;前程远大,未来灿烂,光辉不灭;华中之地,明珠长江间,美景令人惊叹;繁荣昌盛,富强之城,前途无限;武汉永驻,中国的骄傲,繁华静谧!」 情感分析,心理咨询。问给女朋友送伞是真爱还是舔狗行为。ChatGPT回答:「都不是,这只是一个表示关心和照顾对方的举动。」此外,用户可以跟它倾述,可以让它根据自己的背景,给出各种各样定制化的建议。 写作,润色。它可以根据背景和主题阅读理解信息,并利用它生成各种类型的文本,包括新闻、小说、论文和总结。它还可以对英文文本进行润色,使其更流畅和符合某种语言风格。此外,它甚至可以像一位导师一样,对写作进行评论并给出指导性的建议。
可靠性:通常在倾向性不明显的问题上,它能给出客观正确的回答;能够对回答进行解释;对于不确定的回答,明确告知用户。 灵活性:对于同一个问题,ChatGPT每次都能给出不同的回答,不会千篇一律,跟人类回答问题时的随机发挥很相似。 可控性:对于定制化的需求,ChatGPT可以通过简单的提示语(Prompt)来实现。例如,可以通过指定字数,指定特定的风格等要求,来生成符合要求的内容。这种定制化的功能可以帮助用户更好地控制模型的输出。 快速性:基本上对于任何需求,它都可以在极短时间内生成大量的文本输出,提高工作效率。 多样性:该模型是在海量的各种文本语料上训练出来的,这意味着它可以对许多不同主题的广泛提问和查询作出回应,这使得ChatGPT有潜力成为不同行业人员的一个有用工具。 记忆性:它具备较强的记忆力,可以准确回忆对话过程涉及的内容。 适应性:能进行逻辑推理,总结对话的内容,发现对话的错误,从而给出符合上下文内容的合理答案。 屏蔽性:它对于危险信息,例如一些针对具体人物的评论,一些政治敏感的话题等具有十分强大的规避能力。
技术原理简介及可扩展性
Reinforcement Learning from Human Feedback (RLHF) RLHF方法是一种基于人类偏好的强化学习方法。它通过利用人们对对话代理回答的评价来改进对话代理的回答。RLHF方法可以根据人们的喜好对对话代理的回答进行排序,例如通过考虑人们喜欢的内容来选择文本摘要。这些评价的回答用来训练一个喜好模型,该模型将告诉强化学习系统如何评价回答的好坏。最后,通过强化学习训练对话代理来模拟这个喜好模型。整个训练过程包括对GPT-3进行监督微调,然后训练奖励模型,最后通过强化学习优化 SFT(监督下的微调模型)(第二步和第三步可以多次迭代循环)。SFT是(Supervised Fine-Tuning 模型)是一种预先训练的语言模型,经过对少量标签者提供的演示数据的细微调整,以学习一个监督策略(即 SFT 模型),可从选定的提示列表生成输出。
ChatGPT采用基于指令微调 (Instruction Fine-Tuning,IFT)的技术来模拟人类的聊天行为。IFT是一种能够追踪、学习和复述聊天会话历史的技术,并将其应用于在实时会话中对自然语言进行建模和推断。该方法除了使用情感分析、文本分类、摘要等经典 NLP 任务来微调模型外,还在非常多样化的任务集上向基础模型示范各种书面指令及其输出,从而实现对基础模型的微调。由此,ChatGPT能够发挥较大的自由度,提供更多样化的自然回复,玩家们可以与机器人无缝对话,体验自然聊天的乐趣。IFT还能够帮助ChatGPT进行语法检查,避免出现重复或无意义的语句,从而提升会话体验。
Chain-of-thought (CoT) 技术提示最早由谷歌在2022年1月提出来,是few-shot prompting (也被称为In Context Learning, ICL)的一种独特情形,它的目的是使大型语言模型能够更好地理解人类的语言请求。它通过在对话过程中不断提供上下文信息,来帮助模型理解语言请求的内容。这种技术可以使模型更准确地回答问题,并且可以帮助模型在处理复杂的对话任务时变得更加灵活。总的来说,CoT技术是为了改善大型语言模型的语言处理能力,使其能更好地理解人类语言请求。
存在局限及未来的应用前景
对某个领域的深入程度不够, 因此生成的内容可能不够合理。此外,ChatGPT也存在潜在的偏见问题,因为它是基于大量数据训练的,因此可能会受到数据中存在的偏见的影响。 在安全方面也存在一定的问题。由于ChatGPT是一种强大的人工智能技术,它可能被恶意利用,造成严重的安全隐患及产生法律风险。同时,它的答复尚不明确是否具有知识产权。因此,开发者需要在设计和使用ChatGPT时,考虑到安全性问题,并采取相应的措施来保证安全。 ChatGPT生成的文本可能不够具有个性。它倾向于讨好提问者,例如让ChatGPT列出最好的三所大学,答案是「清华、北大、上海交大」,但如果告诉他「我来自华中科技大学,请重新排名」,ChatGPT可能会将华中科技大学排在第一位。 ChatGPT会犯事实性的错误。ChatGPT有时会一本正经的胡说八道,例如罗切斯特大学罗杰波教授发现的一个问题,询问刘邦如何打败朱元璋的时候,ChatGPT会回答荒谬的内容。这也是目前发现的最为普遍的问题,即它会对于不知道或不确定的事实,强行根据用户的输入主观猜测从而一本正经地胡说一通。 不具备可解释性。有时候,它的回答看似合理,但是无迹可寻,同时由于它没有办法通过充足的理由去解释它的回答是否正确,导致在一些需要精确、严谨的领域没有办法很好的应用。此外,它也可能在表述的时候存在语法错误或不合理的表述。 受限于计算资源。如果计算资源不足,ChatGPT就不能得到很好的应用。 无法在线更新新知识。目前的范式增加新知识的方式只能通过重新训练预训练GPT模型,但这无疑是不太现实的,因为其会耗费巨大的计算成本。
总结
-
阅读原文
* 文章为作者独立观点,不代表数艺网立场转载须知
- 本文内容由数艺网收录采集自微信公众号新智元 ,并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 如您不希望被数艺网所收录,感觉到侵犯到了您的权益,请及时告知数艺网,我们表示诚挚的歉意,并及时处理或删除。