4月14日,OpenAI要发GPT-6了。内部代号”Spud”(土豆),听着有点随意,但这次发布可能是AI行业三年来最重要的一次。

确认的信息

OpenAI在4月8日官宣,GPT-6将于4月14日全球同步发布。预训练已经在3月17日完成,目前在做最后的安全对齐和API调试。

这次研发周期18个月,训练投入超过20亿美元,用了大约10万张H100 GPU。参数规模在5到6万亿之间,但因为是混合专家架构(MoE),实际激活的参数只有10%左右。

三个核心升级

200万Token上下文

这是最直观的提升。200万Token大约相当于150万字,两部《三体》的体量。

以前处理长文档,要么分段,要么用RAG(检索增强生成)。现在可以直接把整个代码仓库、几十份合同、一套产品文档塞进去,模型能完整理解。

但有个工程问题:上下文越长,推理成本越高。腾讯云的测算显示,中小型知识库用长上下文方案,比RAG更简单准确,但每次查询的成本和延迟都上去了。

原生多模态统一

GPT-6用的是”Symphony”架构,文本、图像、音频、视频在同一向量空间处理。以前的多模态是模块拼接——文本模型加个图像理解插件,像让语言天才再去学画画。现在是底层统一编码,交互更连贯。

具体到应用:手绘草图可以直接生成前端代码,上传视频能拆解动作细节并生成脚本,语音指令能完成从创意到视频成片的全流程。

双系统推理框架

这套框架对应认知科学里的”快思考”和”慢思考”。

System-1负责快速响应和内容生成,System-2负责逻辑校验和多步推导。简单问题用快系统,复杂问题切换到慢系统。这解释了为什么性能提升能达到40%——不是单纯堆参数,而是让模型知道什么时候该快、什么时候该慢。

AGI的最后一公里?

OpenAI内部把GPT-6定位为”通往AGI的最后一公里”。奥特曼在近期的内部讲话里提到,模型在聊天场景上已经饱和了——意思是单纯的能力提升正在逼近收益递减的拐点。

GPT-6的智能体能力是关键测试点。OpenAI试图把ChatGPT、编程工具Codex、浏览器工具Atlas整合成一个统一的超级智能体。如果落地效果达到预期,AI能自主规划并执行复杂任务链,不需要人工频繁干预。

关停Sora的信号

GPT-6发布前,OpenAI关停了Sora视频生成业务,连API都下了。

Sora上线时很轰动,10天下载量破百万,但整个生命周期应用内购收入只有210万美元。视频生成是最消耗算力的AI任务,用户规模越大,亏损越严重。《福布斯》估算,Sora每年的运行成本超过50亿美元。

更麻烦的是版权和合规压力。上线初期靠生成迪士尼IP、名人形象出圈,随之而来的是大量诉讼。OpenAI被迫把生成规则从”默认可用”收紧为”需明确授权”,直接砍掉了产品最核心的吸引力。

关停Sora,全力押注GPT-6,本质上是OpenAI在上市前夜对商业叙事的重塑——从炫酷的生成能力吸引C端用户,转向稳定、高效的生产力能力服务B端企业。

竞争环境变了

GPT-6发布时,OpenAI面对的竞争格局已经和三年前完全不同。

Anthropic用Claude Code占据了编程市场的半壁江山,企业付费市场份额高达73%,年化营收突破300亿美元。谷歌在4月2日开源了Gemma4系列,20亿参数的模型能在手机上离线运行,性能追平上代270亿参数的模型。阿里在同一天推出通义千问Qwen3.6-plus,在CodeArena的react专项榜单中位列全球第二。

国内厂商的节奏也很快。字节跳动的豆包2.0支持私有化部署,日均Token消耗已达120万亿,三个月翻了一倍。

OpenAI押注”全能型选手”路线,Anthropic走的是”专家型选手”路线——不做视频、不做硬件、不做内容,只专注文本、代码和企业级场景。到目前为止,资本流向和市场份额都在向后者倾斜。

定价和发布节奏

定价方面,OpenAI选择了相对保守的策略:输入$2.5/百万Token,输出$12/百万Token,和GPT-5.4基本持平。

发布节奏分阶段:

  • 4月14日:ChatGPT Plus/Pro用户优先体验
  • 4月21日:企业/开发者API接入
  • 5月1日:免费用户开放核心能力
  • 6月:企业私有化部署和行业定制版

对开发者意味着什么

200万Token上下文可能改变AI应用架构。中小型知识库不再需要搭建向量数据库和检索系统,直接把文档喂给模型就行。但每次查询的成本会增加,适合对准确性要求高、查询频率不高的场景。

原生多模态意味着开发门槛降低。以前要调用多个模型、处理格式转换,现在一套API解决。

智能体能力的增强可能让”AI接管工作流”从概念变成现实。程序员上传百万行旧代码,AI能自动重构、修复漏洞、生成新功能。职场人语音记录会议,AI能生成结构化纪要、任务分配、执行时间表。

留给OpenAI的时间窗口

OpenAI的估值已经到8520亿美元,3月底完成了1220亿美元的融资。但融资结构里有刚性约束:亚马逊500亿美元认购中有350亿美元设置了IPO触发条件,英伟达和软银各300亿美元同样附有对赌条款。

这些资本的诉求很明确:在限定时间窗口内看到清晰的退出路径。GPT-6不仅要证明技术实力,还需要推动OpenAI尽快上市。

但IPO的内部阻力不小。CEO奥特曼想最快今年四季度上市,CFO萨拉·弗莱尔则认为2026年尚不具备条件。分歧的核心在财务基本面:200亿美元年化营收面对570亿美元的年烧钱速度,亏损仍在扩大。

如果GPT-6不能在编程和企业级市场拿出令人信服的表现,这场路线之争的天平会加速倾斜。

4月14日之后

GPT-6的发布可能重新划定AI竞赛的赛点。行业焦点从”能不能做出来”转向”能不能用起来”。

对普通用户来说,最直接的感受会是:AI能记住更长的对话、理解更复杂的任务、不再需要频繁切换工具。对开发者来说,架构设计需要重新思考——200万Token上下文能简化很多东西,但也会带来新的工程挑战。

至于AGI,GPT-6可能不是终点,但至少是能看到终点的一站。奥特曼说过,模型在聊天场景上已经饱和了。接下来要比拼的,是能不能让AI真正变成解决问题的工具,而不是只会聊天的玩具。

4月14日,答案揭晓。