《猫猫钓游记》可爱+收集+钓鱼游戏试玩
2026-06-30
2026-07-05 0
2026年6月,JetBrains 宣布在其 AI 助手中,将 OpenAI 的 Codex 设置为“推荐的智能体”(Recommended Agent)。这并非一次随意的合作,而是一个经过严谨数据验证、并深刻反映 JetBrains 产品哲学的决策。
在 Codex 成为默认之前,JetBrains IDE 的 AI 用户需要自己从多个智能体(如 Junie、Claude Agent 或自带的 ACP 兼容智能体)中选择。这赋予了用户最高的自由度,但也带来了选择的负担。
JetBrains 观察到,随着模型能力的提升,智能体(Agent)能帮助用户完成比简单对话更多、更复杂的工作。因此,推荐一个开箱即用、能力均衡的智能体,能显著降低新用户的入门门槛,让用户能立刻体验到 AI 辅助编程的核心价值。这背后,是 JetBrains 一贯的“开箱即用、体验优先”设计理念的延续。
JetBrains 的选择并非基于印象或合作关系,而是建立在一个名为 开发者生产力 AI 竞技场(DPAIA) 的开放基准测试上,结合了离线基准测试与在线 A/B 测试。
JetBrains 从三个维度对候选智能体进行量化评估:
JetBrains 将“成本”和“延迟”与“解决率”并列为核心指标,这非常务实。它表明 JetBrains 追求的是一种面向真实开发者的实用主义平衡,而非实验室环境下的极限性能。
如下是codex的数据

在最终候选者 Codex(GPT-5.4-mini medium)和 Junie(Gemini 3 Flash)之间,数据表现得极为接近,这从侧面印证了当前 AI 智能体的竞争已经进入了白热化阶段。
从表格可见,Codex 在综合解决率上略胜一筹,但 Junie 在延迟和成本上表现更好。两个智能体在不同语言上各有优势(例如 Codex 在 C# 上解决率更高,Junie 在 Java 上领先)。
最终决定性的因素来自于线上 A/B 测试中的 “用户留存、切换率和失败率” 等行为数据。在这些更能反映真实长期价值的指标上,Codex 最终胜出。
我认为,JetBrains 选择 Codex 作为推荐智能体,是一个集“用户、数据与战略”于一体的决策。
JetBrains 将 Codex 设为推荐 AI 智能体,是一次完美的产品、数据与战略结合的典范。它基于严谨的测试,做出了一个对当前用户最友好的选择,同时通过公开的基准测试和开放的切换机制,展现了其作为平台构建者的成熟心态。对于开发者而言,这意味着在 JetBrains IDE 中,可以以一个更低的起点,体验到当前最优秀的 AI 辅助编程能力,并且拥有不被锁定的自由。