---
title: 编程 Agent 的 API 成本
date: '2025-12-31 12:23:10'
draft: false
summary: 如果要把 AI 真正接进 CI 和多 Agent 并行工作流，模型能力当然重要，但更硬的约束其实是 API 成本能不能低到可持续。
slug: api-cost-matters-for-coding-agents
syndication:
- platform: X / Twitter
  url: https://x.com/jolestar/status/2006219555123900801
tags:
- ai
- coding
- api
topics:
- ai
- software-engineering
type: post
---

最近把主力编程模型切换到了 GLM 4.7，整体感觉还是能打的。

之前用 Cursor 的 200 美金套餐，不够的话还会触发按需付费，最高的一个月大概干掉了 400 美金。现在我的用法基本是：在 Codex 里聊需求，用最低档的 Pro 就够，然后把需求整理成 issue，让 `holon` 去完成，`holon` 里配置的模型就是 GLM 4.7。

GLM 这边用的是包季套餐，1200 人民币，多 Agent 并行跑，目前还没有遇到过限额问题，最近 7 天大概用掉了 7 亿 token。

## 为什么 API key 模式很关键

GLM 的套餐是包含 API key 模式的，这一点其实很关键。

因为它本身没有类似 Coding Agent 的客户端工具，也没办法通过特殊的认证方式来区分使用场景。但像 Codex、Claude Code 这种，包月模式和 API 按需付费之间的成本差异其实是非常大的。

我在 `holon` 里试过一次直接配置 Claude 的官方 API key，一个稍微复杂一点的 PR，成本就接近 10 美金。

这在把 AI 放进 CI、让它反复跑的场景下，其实是很难接受的。所以如果没有价格足够低、同时智力水平又还可以的模型，云端编程这种模式是很难真正跑起来的。

## 为什么我不太看好会员模式

不过我也不太看好这种会员模式能长期持续。

一方面，现在已经有不少中间代理，靠着会员价和 API 价之间的差额来薅羊毛，反过来逼厂商不断收紧额度；另一方面，对客户端 Agent 工具来说，会员本身也没有什么忠诚度和绑定性，用户最终在乎的还是能不能稳定、低成本地把 API 用起来。

从这个角度看，厂商与其强推一个自己的客户端，不如把 API 价格打下来，让各种 Agent 工具都能接入。

等明年再卷几轮价格，API 成本继续下降，更多的 Agent 应用就会自然冒出来。