Transformer作者爆料GPT-5.1内幕！OpenAI内部命名规则变乱了

鹭羽发自凹非寺量子位 | 公众号 QbitAI

“我们正在经历一次静悄悄、但本质性的AI范式转换。它的意义不亚于Transformer本身。”

过去一年里，关于AI发展，出现了两种观点的分化：

一边是“AI增长放缓、模型到顶、预训练无用论”另一边则是隔三差五就来一次“AI大周”：GPT-5.1Gemini 3Grok 4.1

而Transformer作者之一、现任OpenAI研究科学家的Łukasz Kaiser最近接受采访，给出了第一视角的解答。

信息量极大，包括AI的底层范式转变、GPT-5.1的命名规则、未来AI的发展趋势……以及Transformer诞生背后的二三事。

AI不是变慢了，而是换代了。GPT-5.1不是简单的小版本迭代，OpenAI内部版本命名规则有所变化。多模态推理将会成为下一个突破点。AI不会让人类完全失去工作。家用机器人是继ChatGPT后最可见的AI革命。

下面一起来康康详细内容：

AI发展没有放缓，而是平稳增长

过去一年里，有关“模型进展变缓”的声音层出不穷，但Łukasz认为这种看法是错误的。

他给出的解释也很直白：

从内部视角看，AI的能力增长是一条非常平滑的指数曲线。

这类似于摩尔定律，几十年来摩尔定律始终有效，甚至在GPU的推动下还在加速，归根结底也是因为它历经了数代技术的迭代。

因此，AI从外部看，趋势是平稳的；而从内部看，其进步也离不开新技术、计算机能力的提升和工程优化的共同作用。

至于为什么会有人觉得“变慢了”，原因无它：AI的底层范式，已经悄悄从预训练转向推理模型。

这也是继Transformer诞生后的又一次关键转折。

如果把技术发展的过程描述为一条S型曲线（起步→快速增长→平稳期），那么预训练就处于S曲线的上升后期，而推理模型仍处于初期。

不过这并不意味着预训练的Scaling Laws就失效了，它仍在发挥作用，只是和新的推理范式相比，需要投入更多的资金。

所以出于经济上的考量，业内人士开始普遍将工作重心转向更小也更便宜，但质量相同的模型，所以这也是导致外界认为预训练已经停止的原因之一。

那么回到推理模型上，由于该范式还处于新兴阶段，进步速度会相当之快。

以ChatGPT为例，GPT-3.5会直接基于训练数据记忆给出答案，而不会借助任何外部工具和推理，反观现在最新的ChatGPT会主动浏览网站、进行推理分析，再给出准确答案。

对于普通用户来说，如果不仔细对比，可能会觉得二者差异不大，但实际上这背后是性能质的飞跃。

又比如说Codex，程序员的工作方式已经在近几个月里转变为“Codex先处理，然后人工微调”的模式，这种变化其实相当之彻底，但如果不是专业从事编程工作，自然不会留意到这种根本性变革。

所以总的来说，这一切的变化都发生得太快，以至于让人们还未曾察觉到其中的变化。

而推理模型的本质其实也与基础大模型类似，只是在给出最终答案前，会优先进行思考，也就是所谓的思维链。

在思考过程中，模型被允许使用工具，例如浏览网页，以给出更准确的答案。其推理过程也会被视为模型的一部分并接受训练。

相比于传统的深度神经网络梯度下降训练，推理模型则更多使用的是强化学习。

具体来说，强化学习会通过奖励机制推动模型获取更好的答案，也需要研究人员提供更细致的数据准备，以完成强化学习的参数调整。

然后通过强化学习，模型就能学会对自身错误的纠正。

后续行业也会继续转向更复杂的强化学习，例如借助一个大模型来判断答案的正确性或偏好度，或者融入更多的人类偏好。

总之，未来强化学习的应用范围会更加广泛，不仅仅适用于特定领域，还能处理更多通用数据，比如说多模态推理，虽然最近Gemini已经能够在推理过程中生成图像，但整体来说还处于刚刚起步的阶段，相信在强化学习的帮助下会有进一步的提升。

GPT-5.1绝非表面上的小版本更新

关于最近发布的GPT-5.1，Łukasz也释出了更多细节。

GPT-5.1看起来只是小版本更迭，实际从内部来讲，是一个巨大的稳定性迭代。

首先回到最初的GPT-4到GPT-5，简单来说，得益于强化学习和合成数据的应用，GPT-5的推理能力明显提升了。

而到GPT-5.1的改进，则更多集中在后训练阶段，比如增加安全性、减少幻觉，以及添加了如书呆子、专业等多种风格选择。

版本的命名方式也不再与技术细节挂钩，转而以用户体验为导向，比如GPT-5是基础能力较强的模型，GPT-5.1是能力更优的版本，Mini是更小、更快、更廉价但性能稍弱的模型，推理模型则专注于复杂任务。

这种命名方式的转变也为OpenAI内部带来了更多灵活性，现在强化学习、预训练、幻灯片优化等多个项目并行工作，然后通过蒸馏技术就能将多项目成果整合到一个模型中。

这大大缩短了模型迭代时间，可以更好地满足用户体验需求，所以GPT-5.1看似是小版本更新，实则背后是OpenAI基于用户对其能力和目标预期做出的策略调整。

不过坦白地讲，GPT-5.1在部分能力上仍然存在短板。

比如Łukasz用自己5岁的女儿举了个例子——

GPT-5.1能够游刃有余地解决奥林匹克竞赛题，但在面对小学一年级的数奇偶数题目上却错误百出。

该题目内容是，图中有两组点，中间有一个共享点，问总点数是奇数还是偶数。

5岁的孩子能够在10秒内就算出答案（因为共享点的存在导致总点数为奇数），但无论GPT-5.1还是Gemini 3都会自动忽略这个共享点，误判为偶数。

这主要还是因为模型缺乏足够的多模态能力，也未能将一个问题的推理经验迁移到相似场景中，所以后续他们将会在训练中进一步强化多模态推理和上下文推理迁移能力。

从谷歌Transformer走向OpenAI

而作为Transformer的作者之一，Łukasz也在访谈中补充了很多诞生细节。

Łukasz自己原先是一名专注于理论计算机科学的学者，高中时就对数学和计算机充满兴趣，并在德国获得了理论计算机科学与数学博士学位。

他一直对“思维是如何运作的”、“智能的本质是什么”诸如此类的问题充满好奇，也曾在法国获得终身教职，从事逻辑和编程研究。

直到深度学习兴起，他加入了谷歌。

先是成为了Ray Kurzweil团队的一员，后转至Google Brain，开始与Ilya Sutskever等人合作。

在开发Transformer的过程中，Łukasz主要负责编码和系统工作，参与TensorFlow框架的开发。

不过有趣的是，据他回忆，Transformer论文的八位共同作者从未在同一个物理房间中共同出现过。

而虽然他们彼此之间素未谋面，但他们通过不同角度共同构建了这个模型：

有人专注于注意力机制本身，有人研究如何通过前馈网络存储知识，还有人复杂解决工程实现问题，比如他自己。

从现在的角度看，Transformer毫无疑问是当今AI架构的里程碑，但在当时，很多人对用同一个模型处理多个任务的想法并不理解，他们普遍认为不同任务就应该分别训练不同的专有模型。

而他们八个人坚信自己的选择，后来的事实也证实了他们的想法是正确的。

关于之所以离开谷歌，转投OpenAI，其中一个原因还是因为llya。

llya在谷歌时期就是Łukasz的直系领导，在创办OpenAI后也屡次邀请他加入。刚好这时，Łukasz也无法适应Google Brain的团队规模扩大以及远程工作氛围，于是一拍即合，来到了OpenAI。

OpenAI也没有让他失望，这里没有严格的组织架构，都是根据项目自发组队，也会根据项目进展灵活调整，直到项目成熟才会逐步扩大团队。

当然不同项目之间也会存在资源竞争，毕竟OpenAI内部GPU资源有限。

从技术层面看，预训练目前消耗的GPU资源最多，其次是强化学习和视频模型，资源分配在很大程度上还是由技术需求决定。

所以竞争不可避免，Łukasz本人也不例外。

下一次突破来自多模态推理+具身智能

最后，Łukasz聊了聊他眼中的AI未来。

AI会改变工作，但不会让工作消失。

因为从产品层面上看，即使AI自动化了绝大部分任务，但人类专家的需求仍然存在。

以翻译行业为例，其实Transformer论文最初的应用场景就是翻译，现在的模型也能准确翻译西班牙语、法语等语言，但对于报纸广告乃至ChatGPT UI界面，仍然需要人类译者进行二次审核。

这本质上是信任问题，即使模型能力再强，对于一些高风险、高关注度的场景，还是会倾向于依赖人类专家经验。

只是说，对于另外一些基础工作，可替代性会变高，后续也会出现相应的工作内容变化，但归根结底不会让人类无事可做。

Łukasz还预计，家用机器人可能会成为“下一次更为直观的AI革命”。

机器人技术的进展，取决于多模态能力和通用强化学习、通用推理的进步。一旦这些领域取得突破，机器人技术必将迎来爆发式增长。

目前已经有很多硅谷公司在相继推出智能手遥操作等硬件产品，硬件基础也将迅速成熟，届时将协同多模态和物理世界推理能力，实现家用机器人的能力跃迁。

这将会比ChatGPT更直观、更易感知。

参考链接：[1]https://www.youtube.com/watch?v=3K-R4yVjJfU&t=2637s

《开元1383去哪里了》，《首次登录送91元红包》

亚娱网址

“爱游戏手机APP”

永乐国际勇往直前乐在其中2022

……

{!! riqi() !!}

“必威手机官网登陆”{!! reci() !!}

↓↓↓

{!! reci() !!}，是{!! reci() !!}

{!! riqi() !!}，国际乒联混团世界杯：中国队战胜埃及队，哪里可以玩真钱德州，世界杯彩票投注怎么买，沙巴体育网投平台，最大的博彩app，凯时网址多少|果博东方官网|斗牛怎么可以赢钱|美高梅国际现金娱乐|打鱼注册送3元|沙巴体育电子网投

{!! riqi() !!}，关注呼吸道传染病防控：全国流感进入中流行水平各地积极应对，正规实体网投AG平台，彩票体育投注，新开游戏，澳博注册网站平台

{!! riqi() !!}，特写：钉鞋声里的“工匠精神”，真人AG，鸭脖体育官网链接，沙巴体育篮球玩法，爱游戏app下载地址

{!! riqi() !!}，北京最新考古研究成果发布箭扣长城首次发现崇祯五年火炮，永利体育投住网，澳门网上网站网址大全，NBA押注，手机必赢亚洲网页登录

{!! riqi() !!}|青海构建融合发展体系推动阅读从书页“走向”生活|bepaly体育下载|刺激战场国际版哪个区真人多|凯时优质运气营商|皇冠体育赛事

{!! riqi() !!}|香港大埔宏福苑火灾中受伤的12名消防员已出院|太阳集团游戏城旧版|天辰娱乐登录测试|nba买球网站|博彩公司世界杯投注

{!! riqi() !!}|勿让抢行加塞成为交通事故“导火索” 交替通行可使合流区通行效率提升|fb官网下载|AG试玩入口|电子游戏登录大全|乐虎国际在线开户……

{!! riqi() !!}，年均发放高龄补贴29亿元陕西推进养老服务提质增效，历届世界杯八强比分，必发网，电玩官网app，188宝金博手机登录

{!! riqi() !!}，山西大同再获“活力之城”殊荣 “文化引擎”驱动千年古都焕新IP，888真人快速注册，单机斗地主六月版破解版，手机娱乐注册，天博tb体育下载

{!! riqi() !!}|咖啡制作、自主配送全覆盖！首届北京智慧酒店机器人大赛解锁服务新范式|威尼斯人手机版入口|三亿体育下载地址|云顶娱乐手机版网页登陆|米乐网页版注册登陆失败

{!! riqi() !!}，河北秦皇岛智慧消防产业集群年销售近40亿元，金宝搏188下载，世界杯足球下注，幸运快三官方网站，九州APP安卓

{!! riqi() !!}，青春华章丨中青网评：挺起强国复兴的青春脊梁，赌博app排行榜，Betway精装版，世界杯买球中了退本金吗，澳门皇冠app在线下载

{!! riqi() !!}，第九届中央文献翻译与研究论坛在天津外国语大学开幕，九州娱城乐十年信誉玩家首选，od体育网页版登录，蒲京娱乐平台，伯爵互娱游戏

{!! riqi() !!}|辽宁消防274检查组夜查高层建筑重大火灾隐患|世界杯在那买球|银河平台首页|AG亚洲厅|龙8官网手机版下载安装

{!! riqi() !!}|香港特区举行悼念活动哀悼大埔宏福苑火灾罹难人士|博易体育导航|beat365中国官方网站|华体会投注|澳门十大电子

{!! riqi() !!}|李锦记家族捐款支持大埔火灾救援工作|e世博客户端下载|365bet体育盘口|亚美乐优惠永远多一点|威廉网站是多少

{!! reci() !!}，{!! reci() !!}|“链”上湖南 “湘”创未来丨一门戏，六百年茶陵“守艺人”的传承与破圈|世界杯在哪里买球直邮|cbin网站|沙巴体育app皇冠|澳门威尼斯人游戏登入

{!! reci() !!}，{!! reci() !!}|高市早苗涉台谬论越线玩火 “回旋镖”重创日本丨图览天下|杏耀官方登录|巴黎人信誉手机|天博综合体育官方app下载旧版本|十三张牌游戏

{!! reci() !!}，{!! reci() !!}|锁边合龙一周年丨“沙海愚公”共筑青绿|手机打鱼游戏|招财进宝pt游戏|可来博|九州备用登录网址

{!! reci() !!}，{!! reci() !!}|香港各处悼念火灾罹难者民众：这几晚都湿着眼睛入睡|体育彩票官网站|AG注册平台免费下载|顺博体育|澳门威斯尼斯人203119

{!! reci() !!}，{!! reci() !!}|三峡库区：满园“黄金果” 处处好“丰”景|bwin下载地址|百万赢家|必威精装版网页|凤凰彩票app下载

{!! reci() !!}，{!! reci() !!}|南京小学生体育运动活力满满快乐爆棚|优博登录官网|乐游棋牌官网|bob最新官网|皇冠官网多少电子游戏大厅下载官方

{!! reci() !!}，{!! reci() !!}|五年来湖南办理外国人团体入境游签证量居全国第一|AG真人视讯软件计划|天博体育综合平台|威尼斯人网址|可以买球的app平台

监制：邓金木

策划：赖晗

主创：唐征宇林箴贺陈佛烘颜亦阳陈林韵

编辑：王家菁、段圣祺

下载APP

全部

Transformer作者爆料GPT-5.1内幕！OpenAI内部命名规则变乱了

热门视频