午夜咖啡午夜咖啡

jolestar 的文章与笔记。

Post

编程 Agent 的 API 成本

2025-12-31 12:23:10Post

如果要把 AI 真正接进 CI 和多 Agent 并行工作流,模型能力当然重要,但更硬的约束其实是 API 成本能不能低到可持续。

最近把主力编程模型切换到了 GLM 4.7,整体感觉还是能打的。

之前用 Cursor 的 200 美金套餐,不够的话还会触发按需付费,最高的一个月大概干掉了 400 美金。现在我的用法基本是:在 Codex 里聊需求,用最低档的 Pro 就够,然后把需求整理成 issue,让 holon 去完成,holon 里配置的模型就是 GLM 4.7。

GLM 这边用的是包季套餐,1200 人民币,多 Agent 并行跑,目前还没有遇到过限额问题,最近 7 天大概用掉了 7 亿 token。

为什么 API key 模式很关键

GLM 的套餐是包含 API key 模式的,这一点其实很关键。

因为它本身没有类似 Coding Agent 的客户端工具,也没办法通过特殊的认证方式来区分使用场景。但像 Codex、Claude Code 这种,包月模式和 API 按需付费之间的成本差异其实是非常大的。

我在 holon 里试过一次直接配置 Claude 的官方 API key,一个稍微复杂一点的 PR,成本就接近 10 美金。

这在把 AI 放进 CI、让它反复跑的场景下,其实是很难接受的。所以如果没有价格足够低、同时智力水平又还可以的模型,云端编程这种模式是很难真正跑起来的。

为什么我不太看好会员模式

不过我也不太看好这种会员模式能长期持续。

一方面,现在已经有不少中间代理,靠着会员价和 API 价之间的差额来薅羊毛,反过来逼厂商不断收紧额度;另一方面,对客户端 Agent 工具来说,会员本身也没有什么忠诚度和绑定性,用户最终在乎的还是能不能稳定、低成本地把 API 用起来。

从这个角度看,厂商与其强推一个自己的客户端,不如把 API 价格打下来,让各种 Agent 工具都能接入。

等明年再卷几轮价格,API 成本继续下降,更多的 Agent 应用就会自然冒出来。