
deepseek-v4-flashDeepSeek V4 Flash is the lightweight, cost-effective member of the DeepSeek V4 family, tuned for high throughput on general chat and basic text tasks. It has a 1M-token context window, tool calling, JSON output and streaming, and is served via the OpenAI-compatible /v1/chat/completions endpoint at 15% below DeepSeek official pricing ($0.119 input / $0.238 output / $0.00238 cached per 1M tokens).
Lightweight V4 variant tuned for speed and cost on general tasks
Million-token context window for long inputs
Function calling + JSON output, OpenAI-compatible
Priced at DeepSeek official × 0.85
View complete API reference with all parameters and examples.
View complete API reference with streaming, thinking, and more.
Billing: Cost = (input_tokens * input_price + output_tokens * output_price) / 1,000,000
DeepSeek V4 Flash é uma API de modelo de linguagem da DeepSeek. DeepSeek V4 Flash is the lightweight, cost-effective member of the DeepSeek V4 family, tuned for high throughput on general chat and basic text tasks. It has a 1M-token context window, tool calling, JSON output and streaming, and is served via the OpenAI-compatible /v1/chat/completions endpoint at 15% below DeepSeek official pricing ($0.119 input / $0.238 output / $0.00238 cached per 1M tokens). Pela plataforma API Models, você acessa este modelo por uma API unificada a preços bem abaixo das tarifas oficiais. Preço atual: Input: $0.119, Output: $0.238 per 1M tokens.
Crie sistemas de conversa inteligentes que respondem automaticamente e melhoram a eficiência do atendimento.
Escreva automaticamente artigos, e-mails, textos publicitários e mais para aumentar a produtividade.
Auxilie na escrita, depuração e revisão de código para acelerar o desenvolvimento.
Entenda e analise dados não estruturados, extraia insights e gere resumos.
O DeepSeek V4 Flash está disponível pela API Models a: Input: $0.119, Output: $0.238 per 1M tokens. Isso é até 95% mais barato que o preço oficial.
Cadastre-se na API Models, obtenha sua chave de API e chame nosso endpoint unificado. Oferecemos documentação detalhada com exemplos em cURL, Python e Node.js.
A API Models oferece o mesmo modelo DeepSeek V4 Flash com custo 60-95% menor pela nossa plataforma de agregação. Fornecemos uma interface de API unificada, então você não precisa de contas separadas por provedor: uma única chave para acessar todos os modelos.
Na API Models, o DeepSeek V4 Flash roda junto com mais de 60 modelos usando uma única chave de API e um único saldo, então escolher é questão de adequação, não de dependência. Ele suporta High Throughput, Tool Calling, 1M Context, Streaming, OpenAI-compatible e você pode avaliá-lo em preço e capacidade frente a outros modelos de modelo de linguagem, trocando ao alterar uma única string com o nome do modelo — sem nova conta ou integração. Veja todas as opções de modelo de linguagem com preços ao vivo em apimodels.app/models.
O DeepSeek V4 Flash suporta: High Throughput, Tool Calling, 1M Context, Streaming, OpenAI-compatible. Consulte a documentação da API Models para todos os parâmetros e exemplos de chamada.
Sim. A API Models expõe o DeepSeek V4 Flash por uma única API unificada e uma só chave, sem contas separadas por provedor e sem precisar lidar com o acesso de rede regional de cada provedor.
Aceitamos Stripe (Visa, Mastercard e outros cartões internacionais) e Alipay. O saldo fica disponível imediatamente após o pagamento.