一份 config.toml 让本地 Codex CLI 直接调 apimodels 的 GPT-5.4。这里给出完整配置、推理努力等级选项、定价、以及一条 curl 自检命令。
用 wire_api = "responses"(不是 chat),base_url = "https://apimodels.app/api/v1",model = "gpt-5.4",环境变量里放你的 API key。
到 控制台 控制台新建一个 sk_… 字符串。新账户送 $1 起始额度。
把下面这段贴到 ~/.codex/config.toml(没文件就新建)。
export 一下 key,直接 codex 起。
~/.codex/config.toml
# ~/.codex/config.toml
model_provider = "apimodels"
model = "gpt-5.4"
[model_providers.apimodels]
name = "apimodels"
base_url = "https://apimodels.app/api/v1"
wire_api = "responses"
env_key = "APIMODELS_API_KEY"终端
export APIMODELS_API_KEY="sk_…your_key…"
codex| 字段 | 值 | 为什么这么填 |
|---|---|---|
| wire_api | responses | GPT-5.4 在上游只走 /v1/responses,不能用 chat。 |
| base_url | https://apimodels.app/api/v1 | 我们 /v1 端点统一前缀。 |
| model | gpt-5.4 | 或加后缀: -low / -medium / -high / -xhigh,见下表。 |
| env_key | APIMODELS_API_KEY | 随便起名,只要 export 那个变量等于你的 API key。 |
| model_provider | apimodels | 与下面 [model_providers.apimodels] 段名一致即可。 |
想多想几步就在 model 名字后加后缀。所有等级单价相同;努力等级越高,reasoning tokens 越多(算进 output_tokens 一起计费)。
| model | reasoning.effort | 适用 |
|---|---|---|
| gpt-5.4 | none | 快速、单步任务、简单补全 |
| gpt-5.4-low | low | 需要少量推理的常规编码 |
| gpt-5.4-medium | medium | 多步骤重构、设计权衡 |
| gpt-5.4-high | high | 复杂调试、跨文件分析 |
| gpt-5.4-xhigh | xhigh | 最难的题——把时间留给模型 |
每次调用按 usage.input_tokens + usage.output_tokens 实算,会扣到你的 apimodels 账户余额。其他模型价格见 /docs/llm。
装 Codex 之前先用 curl 确认端点和 key 都能通:
curl -s https://apimodels.app/api/v1/responses \
-H "Authorization: Bearer $APIMODELS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.4",
"input": "Reply with exactly: ok",
"max_output_tokens": 16
}'期望响应(节选):
{
"id": "resp_...",
"object": "response",
"model": "gpt-5.4",
"status": "completed",
"output": [{
"type": "message",
"role": "assistant",
"content": [{ "type": "output_text", "text": "ok" }]
}],
"usage": {
"input_tokens": 22,
"output_tokens": 5,
"total_tokens": 27
}
}看到 HTTP 200 + output[0].content[0].text = "ok" 就稳了。
Codex 两种 wire_api 都支持,但 GPT-5.4 系列在上游渠道只暴露 /v1/responses,/chat/completions 走不到这个模型。其它 gpt-* 模型(gpt-5、gpt-5.1、gpt-5.2 等)同时支持两边,你可以用 wire_api = "chat" 配 /v1/chat/completions。但你既然问 GPT-5.4——就用 responses。
| 症状 | 原因 / 修法 |
|---|---|
| HTTP 401 Invalid or missing API key | 环境变量没 export,或 key 已被禁用。重新 export APIMODELS_API_KEY=…,或去控制台新建一个。 |
| HTTP 400 Unknown model: gpt-5.4-foo | 只支持 gpt-5.4 / -low / -medium / -high / -xhigh 这五个变体。检查拼写。 |
| 404 / 端点找不到 | 多半是 wire_api 写成 "chat" 了,Codex 会去打 /chat/completions——GPT-5.4 那边没这个路径,改成 wire_api = "responses"。 |
| 回复是空或只有 reasoning,没正文 | max_output_tokens 太小,推理 token 把预算吃光了。给 high/xhigh 至少留几百 tokens。 |
| 出账多了 | output_tokens 包含 reasoning_tokens。-high / -xhigh 推理 token 可能数倍于可见输出——按需选等级。 |