
rh-lip-sync-videoKling Lip-Sync Video does frame-level lip synchronization, aligning an audio track to the mouth movements of a character in a video — real humans, 3D and 2D animated characters — with local audio upload or online TTS and minute-level duration. The typical flow is to run Kling Face Recognition first to get a faceId, then align audio (uploaded or from Kling Lip-Sync TTS) to that face. Ideal for digital-human voiceover, dub-to-lip-sync and talking animated characters.
Precise lip-audio alignment
Real human, 3D, 2D support
Upload or online TTS
Minute-level video generation
Kling lip-sync is a 3-step flow — run them in order; intermediate values carry forward automatically.
Upload or paste a public video URL; recognition returns sessionId + faceId.
Trimmed audio must be ≥2s; the insert window must overlap the face window by ≥2s.
Kling Lip-Sync Video é uma API de geração de vídeo da Kling. Kling Lip-Sync Video faz sincronização labial em nível de quadro, alinhando uma faixa de áudio aos movimentos da boca de um personagem em um vídeo —pessoas reais, personagens animados em 3D e 2D— com upload de áudio local ou TTS online e duração de até vários minutos. O fluxo típico é executar primeiro o Kling Face Recognition para obter um faceId e depois alinhar o áudio (enviado ou vindo do Kling Lip-Sync TTS) a esse rosto. Ideal para locução de humanos digitais, dublagem com sincronização labial e personagens animados que falam. Pela plataforma API Models, você acessa este modelo por uma API unificada a preços bem abaixo das tarifas oficiais.
Gere rapidamente vídeos promocionais da marca para campanhas e redes sociais.
Crie vídeos curtos atraentes para TikTok, Instagram e YouTube.
Gere demonstrações de recursos e tutoriais para melhorar a conversão.
Produza explicações de cursos, divulgação e vídeos de treinamento a baixo custo.
O Kling Lip-Sync Video está disponível pela API Models a preços bem abaixo das tarifas oficiais. Acesse a página do modelo para ver o preço atual.
Cadastre-se na API Models, obtenha sua chave de API e chame nosso endpoint unificado. Oferecemos documentação detalhada com exemplos em cURL, Python e Node.js.
A API Models oferece o mesmo modelo Kling Lip-Sync Video com custo 60-95% menor pela nossa plataforma de agregação. Fornecemos uma interface de API unificada, então você não precisa de contas separadas por provedor: uma única chave para acessar todos os modelos.
Ele faz sincronização labial em nível de quadro: alinha uma faixa de áudio aos movimentos da boca de um personagem em um vídeo, seja pessoa real ou personagem animado em 3D e 2D, com upload de áudio local ou TTS online e duração de vários minutos. Ideal para locução de humanos digitais, dublagem com sincronia labial e personagens animados falando.
Fluxo típico: primeiro execute o Kling Face Recognition (kling-identify-face) para detectar um rosto no vídeo e obter um faceId; depois alinhe o áudio (enviado ou gerado pelo Kling Lip-Sync TTS) a esse rosto para produzir o vídeo com sincronia labial.
O Kling Lip-Sync Video suporta: Lip Sync, Multi-Character, Audio Alignment, Minute-Level Duration. Consulte a documentação da API Models para todos os parâmetros e exemplos de chamada.
Sim. A API Models expõe o Kling Lip-Sync Video por uma única API unificada e uma só chave, sem contas separadas por provedor e sem precisar lidar com o acesso de rede regional de cada provedor.
Aceitamos Stripe (Visa, Mastercard e outros cartões internacionais) e Alipay. O saldo fica disponível imediatamente após o pagamento.