
gpt-5.4-mediumGPT-5.4 with medium reasoning effort. A few extra thinking tokens before answering — sweet spot for multi-step refactors and design choices that benefit from some reflection but don't need maximum depth.
reasoning.effort = medium — balanced thinking depth
Good for multi-step refactors and design decisions
Reasoning tokens count as output_tokens at base GPT-5.4 rate
wire_api = "responses" + model = "gpt-5.4-medium"
View complete API reference with all parameters and examples.
Enable real-time streaming responses with Server-Sent Events.
{
"model": "gpt-5.4-medium",
"stream": true,
"messages": [...]
}Enable the model to use tools and call functions.
{
"model": "gpt-5.4-medium",
"tools": [{
"type": "function",
"function": {
"name": "get_weather",
"description": "Get current weather for a location",
"parameters": {
"type": "object",
"properties": {
"location": {"type": "string", "description": "City name"}
},
"required": ["location"]
}
}
}],
"messages": [{"role": "user", "content": "What's the weather in Tokyo?"}]
}Get structured JSON responses from the model.
{
"model": "gpt-5.4-medium",
"response_format": {"type": "json_object"},
"messages": [{"role": "user", "content": "Extract info as JSON: John is 30 years old"}]
}| Parameter | Type | Required | Description |
|---|---|---|---|
| model | string | Yes | Model identifier (e.g., gpt-5.4-medium) |
| messages | array | Yes | Array of message objects with role and content |
| max_tokens | integer | No | Maximum tokens in the response |
| stream | boolean | No | Enable streaming responses (SSE) |
| temperature | number | No | Sampling temperature (0.0 - 2.0) |
| top_p | number | No | Nucleus sampling threshold (0.0 - 1.0) |
| tools | array | No | Function calling tools definition |
| response_format | object | No | Output format (e.g., json_object) |
View complete API reference with streaming, thinking, and more.
Billing: Cost = (input_tokens * input_price + output_tokens * output_price) / 1,000,000
GPT-5.4 (medium reasoning) é uma API de modelo de linguagem da OpenAI. GPT-5.4 with medium reasoning effort. A few extra thinking tokens before answering — sweet spot for multi-step refactors and design choices that benefit from some reflection but don't need maximum depth. Pela plataforma API Models, você acessa este modelo por uma API unificada a preços bem abaixo das tarifas oficiais. Preço atual: Input: $0.552, Output: $4.412 per 1M tokens.
Crie sistemas de conversa inteligentes que respondem automaticamente e melhoram a eficiência do atendimento.
Escreva automaticamente artigos, e-mails, textos publicitários e mais para aumentar a produtividade.
Auxilie na escrita, depuração e revisão de código para acelerar o desenvolvimento.
Entenda e analise dados não estruturados, extraia insights e gere resumos.
O GPT-5.4 (medium reasoning) está disponível pela API Models a: Input: $0.552, Output: $4.412 per 1M tokens. Isso é até 95% mais barato que o preço oficial.
Cadastre-se na API Models, obtenha sua chave de API e chame nosso endpoint unificado. Oferecemos documentação detalhada com exemplos em cURL, Python e Node.js.
A API Models oferece o mesmo modelo GPT-5.4 (medium reasoning) com custo 60-95% menor pela nossa plataforma de agregação. Fornecemos uma interface de API unificada, então você não precisa de contas separadas por provedor: uma única chave para acessar todos os modelos.
O GPT-5.4 (medium reasoning) suporta: Medium Reasoning, Refactors, Responses API, Codex-Compatible. Consulte a documentação da API Models para todos os parâmetros e exemplos de chamada.
Sim. A API Models expõe o GPT-5.4 (medium reasoning) por uma única API unificada e uma só chave, sem contas separadas por provedor e sem precisar lidar com o acesso de rede regional de cada provedor.
Aceitamos Stripe (Visa, Mastercard e outros cartões internacionais) e Alipay. O saldo fica disponível imediatamente após o pagamento.