中国驻美大使谢锋:人工智能不能野蛮生长跑马圈地
2026-06-22
2026-06-26 0

篇外推荐,一键收藏全套精选ai收藏链接: 这个“官方精选”AI资源库,才是提效的终极武器!
Claude Code 的创始人 Boris Cherny 前几天在一篇访谈里甩了一组数:从今年 3 月到现在,他个人在 Claude Code 上烧了 80 亿 Token。
80 亿是什么概念?一个重度 Claude Code 用户一个月大概几千万到一亿 Token,Boris 这用量相当于顶格跑 8-10 个月——而且是烧的自家最贵的档(现在全线 Fable,Opus 4.5 出来前是 Opus 档)。
大家好奇的不是"他用得多",是这账到底多少钱。
80 亿 Token 对应的产出:
同期 Anthropic 内部一个数:今年初以来每位工程师代码产出涨了 8 倍,Claude Code 占 GitHub 公开提交 4% 。
Boris 现在全线 Fable——Anthropic 没公开 Fable 明码,但按 Opus 4.5(5/25 每百万)上浮一档估,输入 7 8/输出30~35/百万比较合理。coding 场景典型配比输入:输出 = 3:7(上下文喂得多 + 思考链长),80 亿 = 输入 24 亿 + 输出 56 亿:
| 口径 | 80 亿花销 |
|---|---|
| Fable 目录价(估) | ≈ $21.6 万 ≈ ¥155 万 / 大半年 |
| Opus 4.5 目录价 | $15.2 万 ≈ ¥109 万 |
| Sonnet 4.5 含缓存实付(外部客户落单) | ≈ ¥35-46 万 |
| Boris"内部价" | 他自己原话:"每消耗一个 Token 就少卖给客户一个"——机会成本计价,比目录低但比成本高 |
按月摊的话,即便是 Boris 内部价,这 80 亿摊到大半年也每月五位数美元起步。外部客户硬烧 Fable/Opus 档,80 亿得准备 ¥50-150 万 预算。
横向对照(同 3:7 配比,汇率 $1≈¥7.2):
| 模型 | 80 亿花销 |
|---|---|
| Claude Opus 4.5(目录) | ¥109 万 |
| Codex o3 | ¥178 万(比 Claude 还贵) |
| Codex o4-mini | ¥20 万 |
| DeepSeek-V3.1 | ¥7.7 万 |
| GLM-4.6 | ¥5 万 |
| Qwen3-Plus | ¥2.9 万 |
这是这笔账最值得想的一层。
单价差 10 倍,但 Boris 敢全线 Fable 不是人傻钱多——他自己原话是"我已经穷尽所有能给它的难题,基本一次性解决"。80 亿里相当一块是测试时计算(test-time compute) :一条 prompt 拉几百 sub-agent 并行,虚拟环境跑几小时,耗几百万 Token 出 4 个 PR,把 CI 时间砍半。这种活换 DeepSeek/GLM 不一定扛得住——不是 Token 不够,是模型能力掉一档时,"一次性解决"变"来回修 5 轮",总 Token 反而可能烧更多。
换句话说:省模型单价 ≠ 省总账单,coding 场景尤其如此。Boris 这 80 亿里"贵得值"的那部分,是 Fable 替他避掉的返工 + 架构级重构(那 25 万行删除基本是 AI 自己扫出来的工业残骸)。
当然还有一层——他是 Claude Code 创始人,烧自家 Token 是工作流也是产品狗粮,"每消耗一个 Token 就少卖给客户一个"这话听着凡尔赛,但意思是内部价 ≠ 免费,是按机会成本计的。真要他换 DeepSeek 跑 80 亿,省下来的 ¥100 万出头,对他这产出量级未必划算。
手机写码这件事比烧钱有意思
Boris 卸 IDE 不是 Opus 强到不用 IDE,是"编程从手写逻辑进化到表达意图"——手机能输 intent 就够了。这才是 80 亿 Token 背后真正的工作流变化,比账单数字耐嚼。
Loop > Agent
他的抽象轨迹:手写源码(基础指令)→ Agent(功能函数)→ Loops(高阶函数,Agent 提示 Agent) 。每晚几千个 agent 在后台当"不受薪超级员工"扫代码库、统一冗余抽象。这是下一阶段,不是"换个便宜模型"能解决的。
"给会计也发 Token"
Boris 原话:给全公司——PM、设计师、甚至会计——发 Token。他自己用 Co-work 搞了全自动差旅:AI 读邮件 → 扫日历发现异地行程 → 自主开浏览器订机票酒店,0 人工。非技术岗的 Token ROI 可能比工程师还高,因为他们的 baseline 产出低、自动化杠杆大。
️ Auto Mode 反直觉:AI 监督 AI 比人安全
人类"提示疲劳"→ 盲点"允许"→ 安全黑洞。Anthropic 推 Auto Mode 让模型按安全策略代决策,Claude 抗提示注入 99%。这条跟账单无关,但跟"烧 80 亿的人为什么敢让 agent 每晚跑几千个"有关。
80 亿 Token 这笔账算完,结论其实平常:Boris 烧得起 Claude 档是因为这 80 亿买的不只是 Token,是"一次性解决" + 返工规避 + 产品狗粮。换 DeepSeek/GLM 单价是 1/10,但 1700 PR 里那些架构级活未必扛得住,来回修几轮总账未必赢。
至于普通人——绝大多数团队 80 亿这量级碰不到,但 Boris 这账给的启示是:模型档位分层用比全烧最贵档聪明。主 agent(架构决策、复杂 refactor)上 Claude Opus/Fable,sub-agent(单测、lint、文档)切 DeepSeek-V3.1 / GLM-4.6,同样 80 亿能压到 ¥15-25 万区间。Boris 内部价估计也就这量级,只是他没必要省。
毕竟——自家产品,得自己先烧明白。