
rh-lip-sync-ttsKling Lip-Sync TTS is text-to-speech designed for lip-sync, with multi-language and multi-dialect support, speed control, emotion styles and voice cloning. It generates the voice track that feeds directly into Kling Lip-Sync Video for mouth alignment, so you can synthesize emotionally styled speech (optionally in a cloned voice) and sync it to a character's mouth in one workflow.
Chinese and English voices
Custom voice replication
0.8x to 2x playback speed
Multiple voice personas
Kling lip-sync is a 3-step flow — run them in order; intermediate values carry forward automatically.
Upload or paste a public video URL; recognition returns sessionId + faceId.
Trimmed audio must be ≥2s; the insert window must overlap the face window by ≥2s.
Kling Lip-Sync TTS é uma API de áudio e voz da Kling. Kling Lip-Sync TTS é texto para fala projetado para sincronização labial, com suporte a vários idiomas e dialetos, controle de velocidade, estilos de emoção e clonagem de voz. Ele gera a faixa de voz que alimenta diretamente o Kling Lip-Sync Video para o alinhamento da boca, de modo que você pode sintetizar fala com estilo emocional (opcionalmente em uma voz clonada) e sincronizá-la à boca de um personagem em um único fluxo de trabalho. Pela plataforma API Models, você acessa este modelo por uma API unificada a preços bem abaixo das tarifas oficiais.
Gere locuções de nível profissional para vídeos, animações e anúncios, com vozes variadas.
Produza rapidamente o áudio do seu podcast, com suporte a diálogos de vários personagens.
Converta texto em voz natural e fluida para produzir audiolivros.
Dublagem e tradução multilíngue com IA para alcançar audiências globais.
O Kling Lip-Sync TTS está disponível pela API Models a preços bem abaixo das tarifas oficiais. Acesse a página do modelo para ver o preço atual.
Cadastre-se na API Models, obtenha sua chave de API e chame nosso endpoint unificado. Oferecemos documentação detalhada com exemplos em cURL, Python e Node.js.
A API Models oferece o mesmo modelo Kling Lip-Sync TTS com custo 60-95% menor pela nossa plataforma de agregação. Fornecemos uma interface de API unificada, então você não precisa de contas separadas por provedor: uma única chave para acessar todos os modelos.
É um texto para fala desenvolvido para sincronia labial: multilíngue e com vários dialetos, com controle de velocidade, estilos de emoção e clonagem de voz. A voz gerada vai direto para o Kling Lip-Sync Video para alinhar a boca.
Para quem precisa gerar a faixa de voz de um vídeo com sincronia labial: sintetize o texto em fala com estilo emocional e no ritmo certo (opcionalmente com uma voz clonada) e depois alinhe-a à boca de um personagem no vídeo.
O Kling Lip-Sync TTS suporta: Text to Speech, Multi-Language, Voice Clone, Speed Control. Consulte a documentação da API Models para todos os parâmetros e exemplos de chamada.
Sim. A API Models expõe o Kling Lip-Sync TTS por uma única API unificada e uma só chave, sem contas separadas por provedor e sem precisar lidar com o acesso de rede regional de cada provedor.
Aceitamos Stripe (Visa, Mastercard e outros cartões internacionais) e Alipay. O saldo fica disponível imediatamente após o pagamento.