新闻新闻

OpenAI 的芯片押注，争的是谁掌控等待

TechCrunch 关于 Jalapeño 的报道之所以重要，是因为 OpenAI 正把推理延迟、功耗和供应链当作产品战略来经营，而不只是数据中心的基建问题。

TechCrunch2026年6月25日5 分钟阅读

AIOpenAI半导体基础设施

分享：

AI 驱动

AI 驱动 · 每小时限 20 次请求

卡通数据中心将 AI 请求气泡导入一块大型定制芯片，工程师在旁观察能量流动 — Jalapeño 真正有意思的地方，不在于 OpenAI 有了一块芯片，而在于推理已经重要到让 OpenAI 愿意围绕自己的「等候室」来专门设计硬件。

TechCrunch 在 2026 年 6 月 24 日报道，OpenAI 发布了首款定制推理处理器，由 Broadcom 合作制造，命名为 Jalapeño。表面上的解读很简单：OpenAI 想要更多掌控服务 ChatGPT、Codex、API 以及未来 agentic 产品的硬件。但我的理解更具体一些：这其实是在押注——推理经济学已经成为产品战略，而不仅仅是数据中心的基建问题。

这一点之所以重要，是因为推理才是用户真正能感受到 AI 的环节。训练决定模型能学到什么，而推理决定了用户要等多久、每次请求花多少钱、需求高峰时服务稳不稳定，以及开发者能不能负担得起在 API 上构建有野心的应用。如果 Jalapeño 的表现符合宣传，那它的意义不在于讲了一个更好听的芯片故事，而在于每瓦特、每机架、每美元能产出多少真正有用的智能。

答案快照

问题	我的解读
发生了什么？	OpenAI 与 Broadcom 发布了 Jalapeño——OpenAI 首款面向 LLM 工作负载的定制推理处理器。
为什么重要	OpenAI 正在接管更多服务层环节，以便围绕自家产品优化延迟、功耗、网络和成本。
如果成功，谁受益？	用户、开发者和企业有望获得更快、更便宜、更稳定的 AI 服务；OpenAI 则在供应链和单位经济上获得更多主动权。
我的保留意见	这次发布在公开基准测试、技术规格和生命周期风险方面仍然信息不足。最有力的说法还需要更扎实的证据。

这块芯片的核心是推理

OpenAI 官方公告将 Jalapeño 定义为首款「智能处理器」，称其为 LLM 推理从零开始打造。公司围绕计算内核、内存搬运、网络、调度、部署系统和产品体验来介绍这块芯片。这是一个恰当的抽象层级。瓶颈不只是算力本身，而是有多少有用的模型交互能在系统中高效流转，而不浪费时间和电力。

The Verge 做了一个清晰的区分：推理是模型处理用户请求的阶段，训练是模型从数据学习的阶段。这个区分之所以重要，是因为专用推理芯片不需要解决所有 AI 硬件问题，它只需要把 OpenAI 天天在跑的推理路径做得更好。

用户发出抽象的 AI 请求，经过服务器进入定制芯片，芯片周围标注了速度、效率和稳定性 — 推理一旦改善，产品层面的变化就会体现为更短的等待、更低的服务成本，或者需求高峰时更稳定的访问。

掌控整条栈，改变的是谈判筹码

TechCrunch 点出了显而易见的战略背景：OpenAI 的芯片计划一直被视为降低对 Nvidia GPU 依赖的手段，而 Google、Amazon 等公司早已在使用定制 AI 加速器。 Axios 补充了一个重要边界：OpenAI 表示 Nvidia 仍是关键合作伙伴，尤其是在训练方面。所以我不会把这解读为 OpenAI 立刻脱离 GPU 市场，而是它拒绝把整个服务层交给通用供应链来决定。

这是一种不同的筹码。如果 OpenAI 清楚自己的模型路线图、服务调用模式、内存压力和延迟目标，它就能比通用买家提出更具体的硬件需求。Broadcom 和 Celestica 的重要性就在这里——芯片不只是架构设计，还涉及硅片实现、电路板、机架、网络设备和规模化量产。

性能宣传需要克制

需要谨慎看待的是性能措辞。OpenAI 表示早期测试指向比当前顶级硬件大幅提升的每瓦性能，同时也说最终性能仍在测量中，详细技术报告稍后发布。这足以让人关注，但还不足以盖棺定论。

Tom's Hardware 提出了我认为有道理的质疑：两家公司没有披露硬性性能指标、基准测试、内存配置和许多底层细节。Hacker News 上的评论者也聚焦于「九个月开发周期」说法的模糊之处，以及 OpenAI 用模型加速设计流程的说法。这些说法可能是真的，但缺少里程碑、验收节点和技术细节，仍然很难评估。

工程师用放大镜观察一枚无品牌芯片，旁边摆着空白测试卡和抽象的实验仪器 — 定制芯片的发布，只有当公开证据从方向性描述变成可检验的测量数据时，才会真正有用。

专业化有一块倒计时

真正的取舍在于：硬件迭代慢，而 AI 工作负载一直在变。专用推理 ASIC 之所以高效，恰恰是因为它对工作负载做了更强的假设。但这些假设必须持续有效足够长的时间，才能覆盖设计、制造、部署和运维的完整周期。

这并不意味着这次押注不理智。恰恰相反，它可能是必要的。如果 OpenAI 能在 ChatGPT、Codex、API 和未来 agentic 产品之间找到稳定的共性模式，针对这些模式做专门优化就可能带来巨大优势。风险在于：如果模型架构、上下文行为、工具调用、内存模式或用户需求的变化速度超过了硬件迭代的速度，「为当前最优推理路径优化」很快就会过时。

工程师在天平上比较一块高效定制芯片与不断变化的抽象模型模块 — 定制芯片只有在工作负载足够稳定、专业化投入能够收回时，才能真正胜出。

用户端的意义并不抽象

我关注这件事，是因为它直接关联到用户能感知却很少说出口的那些 AI 产品体验。更快的回答是产品特性。更便宜的 API 调用是产品特性。需求高峰时更多的容量是产品特性。模型能多跑几步而不让交互变卡，也是产品特性。

OpenAI 表示 Jalapeño 计划在 2026 年底开始部署，之后会推出多代平台。Axios 报道，OpenAI 已经在实验室拿到样品芯片，预计今年晚些时候用于客户查询，真正的规模化部署在明年。这让接下来几个季度变得关键。芯片的故事应该从「发布」转向「服务体验是否真的发生了用户能感受到的变化」。

我的结论

Jalapeño 不是天然的 Nvidia 杀手，也还不是一场公开基准测试的胜利。它传递的信号是：OpenAI 现在把推理基础设施视为产品界面的一部分。这个直觉是对的。AI 公司之间的竞争已经不只是模型质量，还包括谁能更便宜、更快、更可靠地把模型能力变成日常交互。

这次发布值得认真对待，但不必过度吹捧。我想看到技术报告、基准测试、部署细节，以及专业化设计在真实工作负载下经受住考验的证据。在那之前，最有力的结论是：OpenAI 正在试图掌控用户发出请求到模型给出回答之间那段等待。如果这段等待在规模化之后变得更短、更便宜，这块芯片的意义将远远超出数据中心。

许可

新闻文本 © 2026 Mark Huang。新闻文本可在非商业场景下分享或翻译，但需署名并链接到 https://markhuang.ai/zh/news/openai-jalapeno-inference-bet.

建议署名： 基于「OpenAI 的芯片押注，争的是谁掌控等待」（作者：Mark Huang），原文发布于 https://markhuang.ai/zh/news/openai-jalapeno-inference-bet。

氛围编程时代，产品需要凭证

Papermark 创始人对 Corgi DataRoom 发布的指控提醒我们：AI 时代的产品发布仍然需要来源追溯、许可证纪律和公开可核查的证据。

2026年6月25日

Gemini Computer Use 需要一个信任闭环

Google 将 computer use 整合进 Gemini 3.5 Flash；真正的考验在于，团队能否让屏幕驱动型 Agent 变得可观测、可沙箱化、可中断。

2026年6月25日

LastPass 的保险库不是唯一的边界

Klue 泄露事件没有攻破 LastPass 保险库，但它说明了一个道理：CRM、客服工单和 OAuth 集成同样影响密码管理器的信任基础。

2026年6月25日