Un único config.toml hace que la CLI local de OpenAI Codex se comunique con GPT-5.4 de apimodels. Esta página muestra la configuración completa, las variantes de reasoning-effort, los precios y una comprobación rápida con curl.
Usa wire_api = "responses" (no chat), base_url = "https://apimodels.app/api/v1", model = "gpt-5.4", y define tu clave API en la variable de entorno. Listo.
Abre Consola en tu consola y crea una clave sk_…. Las cuentas nuevas reciben $0.3 de crédito gratis.
Pega el fragmento de abajo en ~/.codex/config.toml (crea el archivo si no existe).
Exporta tu clave y luego simplemente ejecuta codex.
~/.codex/config.toml
# ~/.codex/config.toml
model_provider = "apimodels"
model = "gpt-5.4"
[model_providers.apimodels]
name = "apimodels"
base_url = "https://apimodels.app/api/v1"
wire_api = "responses"
env_key = "APIMODELS_API_KEY"Shell
export APIMODELS_API_KEY="sk_…your_key…"
codex| Ajuste | Valor | Por qué |
|---|---|---|
| wire_api | responses | GPT-5.4 is only served via /v1/responses upstream — chat mode won't reach it. |
| base_url | https://apimodels.app/api/v1 | El prefijo de nuestro endpoint /v1 compartido. |
| model | gpt-5.4 | O con un sufijo: -low / -medium / -high / -xhigh; consulta la tabla de abajo. |
| env_key | APIMODELS_API_KEY | Cualquier nombre: Codex simplemente lee la variable de entorno que le indiques. |
| model_provider | apimodels | Debe coincidir con la clave de la tabla [model_providers.<name>] de abajo. |
Aumenta la profundidad de razonamiento añadiendo un sufijo al nombre del modelo. Todos los niveles comparten el mismo precio por token; un mayor esfuerzo solo genera más reasoning_tokens (facturados como parte de output_tokens).
| model | reasoning.effort | Usar para |
|---|---|---|
| gpt-5.4 | none | Completados rápidos / de un solo paso / sencillos |
| gpt-5.4-low | low | Razonamiento ligero, programación cotidiana |
| gpt-5.4-medium | medium | Refactorizaciones de varios pasos, compromisos de diseño |
| gpt-5.4-high | high | Depuración difícil, análisis entre archivos |
| gpt-5.4-xhigh | xhigh | Los problemas más difíciles: dale espacio para pensar |
Cada llamada se factura como usage.input_tokens + usage.output_tokens contra tu saldo de apimodels. Los precios de otros modelos están en /docs/llm.
Antes de instalar Codex, confirma que el endpoint y tu clave funcionan con un solo curl:
curl -s https://apimodels.app/api/v1/responses \
-H "Authorization: Bearer $APIMODELS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.4",
"input": "Reply with exactly: ok",
"max_output_tokens": 16
}'Respuesta esperada (truncada):
{
"id": "resp_...",
"object": "response",
"model": "gpt-5.4",
"status": "completed",
"output": [{
"type": "message",
"role": "assistant",
"content": [{ "type": "output_text", "text": "ok" }]
}],
"usage": {
"input_tokens": 22,
"output_tokens": 5,
"total_tokens": 27
}
}HTTP 200 with output[0].content[0].text === "ok" means you're good to go.
Codex supports both wire_api modes, but GPT-5.4 specifically is only routed via /v1/responses upstream — /chat/completions can't reach it. Other gpt-* models (gpt-5, gpt-5.1) work with either; for those you can use wire_api = "chat" against /v1/chat/completions. For GPT-5.4 it must be responses.
| Síntoma | Causa / solución |
|---|---|
| HTTP 401 Invalid or missing API key | La variable de entorno no se exportó o la clave fue deshabilitada. Vuelve a exportar APIMODELS_API_KEY=… o genera una nueva clave en la consola. |
| HTTP 400 Unknown model: gpt-5.4-foo | Solo son válidas las cinco variantes gpt-5.4[-low/-medium/-high/-xhigh]; revisa si hay errores tipográficos. |
| 404 / endpoint no encontrado | Most often wire_api is set to "chat" — Codex then calls /chat/completions, which GPT-5.4 upstream doesn't serve. Set wire_api = "responses". |
| Respuesta vacía o solo razonamiento sin texto visible | max_output_tokens demasiado bajo: los tokens de razonamiento se comieron el presupuesto. Deja varios cientos de tokens para high/xhigh. |
| Factura más alta de lo esperado | output_tokens incluye reasoning_tokens; en -high / -xhigh estos pueden multiplicar varias veces la salida visible. Elige el menor esfuerzo que cumpla con tu nivel de calidad. |