新闻

皇派门窗太空静界舱发布会暨清华大学联合研发启动...

黄浦江畔，风云际会，外滩作为上海的城市封面，见证着百年繁华与时代速度。然而，璀璨灯火与不息车流的...

香港创意之作席卷2025中国国际漫画节动漫游戏展引...
10月2日至10月5日，中国内地动漫游戏领域的重要盛会，2025中国国际漫画节动漫游戏展将在广州保利世贸博览馆盛大开幕。作为国家文化发展规划重点支持的三大动漫会展之一，中国国际漫画节诞生于2008年，经过十数年...
2025丹霞杯扑克大赛即将登陆韶关德信竞技助力小城...
10月8日，2025丹霞杯扑克大赛将在广东省韶关市盛大开赛。这项由韶关市文化广电旅游体育局主办、德信竞技等智力竞技品牌协办的赛事，将吸引来自全国各地的智力扑克高手和爱好者同场角逐，为这座以自然风光闻名的岭...
洗发水贴牌代加工:开启品牌崛起新路径
在竞争激烈的洗发水市场中,众多品牌都在寻求独特的发展之道。而洗发水贴牌代加工,正逐渐成为众多企业迈向成功的关键选择。对于那些怀揣着洗发水品牌梦想的创业者和中小企业来说,洗发水贴牌代加工犹如一把开启...

商业

顾均辉谈品牌定位：新一代“懒人神器”洗鞋机，妙在...

说起被种草的“懒人神器”，哪个最深得你心？有人说是扫地机器人，有人投票给洗碗机，可没想到，洗鞋机今...

如祺车服网约车租售中心开业，一站式服务持续升级！
9月7日，如祺车服网约车租售中心正式开业。如祺车服网约车租售中心集车型展示、销售、售后等全链条车生态服务于一体，助力如祺车服完善一站式服务能力，持续为广大网约车师傅提供高品质服务体验，为产业链上下游...
让我们传承爱与希望！2022同远第五届植得爱亲子公...
护绿，比我们想象中更迫切阿拉善位于我国内蒙古自治区最西端，这里自然条件极为严酷，生态环境脆弱，沙漠化土地总面积占总土地面积的82.3%，且每年以1000千米的速度扩展蔓延速度扩展蔓延。阿拉善的绿洲之...
酒拾烤肉“遇见羊城”广东省专场招商说明会成功举办
2020年8月22日，酒拾烤肉“遇见羊城”广东省专场招商说明会在广州成功举办。全国各地的受邀投资嘉宾齐聚于此，共同探讨酒拾烤肉未来在广东省的发展之路，开启共赢新时代。酒拾烤肉品牌开发总监黄砚方先生、品牌招商...

OpenAI首次推出具有1750亿个参数的巨大GPT-3语言模型

发布时间：2020/06/01 科技 浏览：348

由30多名OpenAI研究人员组成的团队发布了有关GPT-3的论文，该语言模型能够在一系列基准测试和独特的自然语言处理任务（从语言翻译到生成新闻）中达到最新的结果回答SAT问题的文章。GPT-3的参数高达1750亿。相比之下，GPT-2的最大版本为15亿个参数，而微软本月初推出的全球最大的基于Transformer的语言模型则为170亿个参数。

OpenAI去年发布了GPT-2，由于担心该模型可能用于恶意目的，因此有争议地采用了交错发布方法。一些人批评OpenAI的方法交错，而另一些人则称赞该公司演示了一种谨慎发布可能会被滥用的AI模型的方法。GPT-3星期四用arXiv预印本首次亮相，但未提供发布细节。当VentureBeat询问是否要发布完整版本的GPT-3或参数范围从1.25亿到130亿的七个较小版本之一时，OpenAI发言人拒绝置评。

许多基于Transformer的高级模型已经发展到可以在许多自然语言任务上达到人类水平的性能。作者说，近年来基于许多语言模型的进步，基于Transformer体系结构的方法受到特定任务数据集和微调需求的限制。取而代之的是，GPT-3是在无监督机器学习的情况下训练的自回归模型，并且侧重于一次性学习，在推理运行时提供了任务演示。

论文读到：“在这里，我们证明了扩大语言模型可以极大地提高与任务无关的性能，很少需要执行某些操作，有时甚至可以通过现有的最新微调方法达到竞争力。”“对于所有任务，GPT-3的应用无需进行任何梯度更新或微调，其任务和少量演示仅通过与模型的文本交互来指定。”

VBTransform2020Online-7月15日至17日。加入领先的AI高管：注册免费直播。

“广泛地，在NLP任务上，GPT-3在零射和单射设置中取得了可喜的结果，在少射设置中，[有时]与最先进的设备竞争甚至超越（尽管微调的模型拥有最先进的技术），”作者指出。

周四发布的论文研究了大小不一的GPT-3形式，以评估一次性学习，单次学习，最紧密地模仿人类学习方式的单次学习以及零次学习，其中仅描述了在运行时提供任务的编号。

尽管GPT-3在生成新闻文章和任务（例如在句子中使用新颖的单词或执行算术）的效果很好，但在常识性推理方面却不足。在去年专门为测试高级NLP模型的推理和其他任务而引入的SuperGLUE基准上，GPT-3在COPA和ReCoRD读取理解数据集方面取得了近乎最新的结果，但在上下文中却不够分析（WiC）和RACE，一组初中和高中考试题。

“在某些涉及比较两个句子或摘要的任务中，GPT-3在短镜头或单镜头设置中似乎较弱，例如，两个句子（WiC）中是否以相同的方式使用了单词，是否一个句子“这是对另一句话的解释，或者一个句子是否暗示着另一句话，”该论文写道。“通过展现GPT-3的优点和缺点的广泛特征，包括这些局限性，我们希望能够激发对语言模型的少量学习的研究，并引起人们对最需要进步的关注。”

与许多其他预先训练的语言模型不同，本文还包括对GPT-3中发现的算法偏差的初步评估。使用SentiWordNet模型评估了GPT-3种族偏见表现的情绪分析，发现“亚洲人”的得分始终如一，在七个GPT-3版本中，在积极得分方面在种族群体中排名第一。在七个版本的GPT-3中，“黑色”的情感分析得分始终很低。

在对性别与职业之间的关联性进行的评估中，GPT-3根据对近400种职业的分析表明，它最有可能暗示男性身份。最近对预训练语言模型的分析发现，种族，性别，职业和宗教偏见在预训练语言模型中普遍存在，但研究人员发现OpenAI的GPT-2表现出比其他人更理想的结果。

GPT-3文件还包括有关数据污染的文档；训练过程中的能量消耗；高级语言模型的广泛影响；以及潜在的滥用，例如“错误信息，垃圾邮件，网络钓鱼，滥用法律和政府程序，欺诈性学术论文撰写以及社会工程学借口”。

GPT-3接受了关于2016年至2019年收集的近万亿个单词的CommonCrawl数据集以及与Web文本，书籍和Wikipedia相关的数据集的培训。

上一篇: Alyx更新为瓶子增添了平淡而令人印象深刻的液体效果

下一篇: 乘员龙的宇航员给他们的SpaceX宇宙飞船起了个传奇的名字：奋进号

发布时间: