GPT-6发布前瞻：200万Token上下文与AGI最后一公里

4月14日，OpenAI要发GPT-6了。内部代号”Spud”（土豆），听着有点随意，但这次发布可能是AI行业三年来最重要的一次。

确认的信息

OpenAI在4月8日官宣，GPT-6将于4月14日全球同步发布。预训练已经在3月17日完成，目前在做最后的安全对齐和API调试。

这次研发周期18个月，训练投入超过20亿美元，用了大约10万张H100 GPU。参数规模在5到6万亿之间，但因为是混合专家架构（MoE），实际激活的参数只有10%左右。

三个核心升级

200万Token上下文

这是最直观的提升。200万Token大约相当于150万字，两部《三体》的体量。

以前处理长文档，要么分段，要么用RAG（检索增强生成）。现在可以直接把整个代码仓库、几十份合同、一套产品文档塞进去，模型能完整理解。

但有个工程问题：上下文越长，推理成本越高。腾讯云的测算显示，中小型知识库用长上下文方案，比RAG更简单准确，但每次查询的成本和延迟都上去了。

原生多模态统一

GPT-6用的是”Symphony”架构，文本、图像、音频、视频在同一向量空间处理。以前的多模态是模块拼接——文本模型加个图像理解插件，像让语言天才再去学画画。现在是底层统一编码，交互更连贯。

具体到应用：手绘草图可以直接生成前端代码，上传视频能拆解动作细节并生成脚本，语音指令能完成从创意到视频成片的全流程。

双系统推理框架

这套框架对应认知科学里的”快思考”和”慢思考”。

System-1负责快速响应和内容生成，System-2负责逻辑校验和多步推导。简单问题用快系统，复杂问题切换到慢系统。这解释了为什么性能提升能达到40%——不是单纯堆参数，而是让模型知道什么时候该快、什么时候该慢。

AGI的最后一公里？

OpenAI内部把GPT-6定位为”通往AGI的最后一公里”。奥特曼在近期的内部讲话里提到，模型在聊天场景上已经饱和了——意思是单纯的能力提升正在逼近收益递减的拐点。

GPT-6的智能体能力是关键测试点。OpenAI试图把ChatGPT、编程工具Codex、浏览器工具Atlas整合成一个统一的超级智能体。如果落地效果达到预期，AI能自主规划并执行复杂任务链，不需要人工频繁干预。

关停Sora的信号

GPT-6发布前，OpenAI关停了Sora视频生成业务，连API都下了。

Sora上线时很轰动，10天下载量破百万，但整个生命周期应用内购收入只有210万美元。视频生成是最消耗算力的AI任务，用户规模越大，亏损越严重。《福布斯》估算，Sora每年的运行成本超过50亿美元。

更麻烦的是版权和合规压力。上线初期靠生成迪士尼IP、名人形象出圈，随之而来的是大量诉讼。OpenAI被迫把生成规则从”默认可用”收紧为”需明确授权”，直接砍掉了产品最核心的吸引力。

关停Sora，全力押注GPT-6，本质上是OpenAI在上市前夜对商业叙事的重塑——从炫酷的生成能力吸引C端用户，转向稳定、高效的生产力能力服务B端企业。

竞争环境变了

GPT-6发布时，OpenAI面对的竞争格局已经和三年前完全不同。

Anthropic用Claude Code占据了编程市场的半壁江山，企业付费市场份额高达73%，年化营收突破300亿美元。谷歌在4月2日开源了Gemma4系列，20亿参数的模型能在手机上离线运行，性能追平上代270亿参数的模型。阿里在同一天推出通义千问Qwen3.6-plus，在CodeArena的react专项榜单中位列全球第二。

国内厂商的节奏也很快。字节跳动的豆包2.0支持私有化部署，日均Token消耗已达120万亿，三个月翻了一倍。

OpenAI押注”全能型选手”路线，Anthropic走的是”专家型选手”路线——不做视频、不做硬件、不做内容，只专注文本、代码和企业级场景。到目前为止，资本流向和市场份额都在向后者倾斜。

定价和发布节奏

定价方面，OpenAI选择了相对保守的策略：输入$2.5/百万Token，输出$12/百万Token，和GPT-5.4基本持平。

发布节奏分阶段：

4月14日：ChatGPT Plus/Pro用户优先体验
4月21日：企业/开发者API接入
5月1日：免费用户开放核心能力
6月：企业私有化部署和行业定制版

对开发者意味着什么

200万Token上下文可能改变AI应用架构。中小型知识库不再需要搭建向量数据库和检索系统，直接把文档喂给模型就行。但每次查询的成本会增加，适合对准确性要求高、查询频率不高的场景。

原生多模态意味着开发门槛降低。以前要调用多个模型、处理格式转换，现在一套API解决。

智能体能力的增强可能让”AI接管工作流”从概念变成现实。程序员上传百万行旧代码，AI能自动重构、修复漏洞、生成新功能。职场人语音记录会议，AI能生成结构化纪要、任务分配、执行时间表。

留给OpenAI的时间窗口

OpenAI的估值已经到8520亿美元，3月底完成了1220亿美元的融资。但融资结构里有刚性约束：亚马逊500亿美元认购中有350亿美元设置了IPO触发条件，英伟达和软银各300亿美元同样附有对赌条款。

这些资本的诉求很明确：在限定时间窗口内看到清晰的退出路径。GPT-6不仅要证明技术实力，还需要推动OpenAI尽快上市。

但IPO的内部阻力不小。CEO奥特曼想最快今年四季度上市，CFO萨拉·弗莱尔则认为2026年尚不具备条件。分歧的核心在财务基本面：200亿美元年化营收面对570亿美元的年烧钱速度，亏损仍在扩大。

如果GPT-6不能在编程和企业级市场拿出令人信服的表现，这场路线之争的天平会加速倾斜。

4月14日之后

GPT-6的发布可能重新划定AI竞赛的赛点。行业焦点从”能不能做出来”转向”能不能用起来”。

对普通用户来说，最直接的感受会是：AI能记住更长的对话、理解更复杂的任务、不再需要频繁切换工具。对开发者来说，架构设计需要重新思考——200万Token上下文能简化很多东西，但也会带来新的工程挑战。

至于AGI，GPT-6可能不是终点，但至少是能看到终点的一站。奥特曼说过，模型在聊天场景上已经饱和了。接下来要比拼的，是能不能让AI真正变成解决问题的工具，而不是只会聊天的玩具。

4月14日，答案揭晓。