
kling-custom-voiceKling Custom Voice creates a reusable custom voice from an audio sample — upload 5–30 seconds of clean, single-speaker audio (.mp3/.wav/.mp4/.mov) or reference a historical video ID. The resulting voice can be used in Kling TTS and the Kling Lip-Sync models, so a digital human or narration can speak in your proprietary voice and then be lip-synced to video.
Upload .mp3/.wav/.mp4/.mov samples
Use a historical video ID as source
Create reusable voice profiles
$0.006 per voice creation
Clean single voice, 5-30 seconds, no background noise
Create a custom voice to see the result
Kling Custom Voice é uma API de áudio e voz da Kling. O Kling Custom Voice cria uma voz personalizada reutilizável a partir de uma amostra de áudio: envie de 5 a 30 segundos de áudio limpo, de um único locutor (.mp3/.wav/.mp4/.mov) ou referencie o ID de um vídeo histórico. A voz resultante pode ser usada no Kling TTS e nos modelos Kling Lip-Sync, para que um humano digital ou uma narração possa falar com a sua voz proprietária e depois ser sincronizado labialmente ao vídeo. Pela plataforma API Models, você acessa este modelo por uma API unificada a preços bem abaixo das tarifas oficiais.
Gere locuções de nível profissional para vídeos, animações e anúncios, com vozes variadas.
Produza rapidamente o áudio do seu podcast, com suporte a diálogos de vários personagens.
Converta texto em voz natural e fluida para produzir audiolivros.
Dublagem e tradução multilíngue com IA para alcançar audiências globais.
O Kling Custom Voice está disponível pela API Models a preços bem abaixo das tarifas oficiais. Acesse a página do modelo para ver o preço atual.
Cadastre-se na API Models, obtenha sua chave de API e chame nosso endpoint unificado. Oferecemos documentação detalhada com exemplos em cURL, Python e Node.js.
A API Models oferece o mesmo modelo Kling Custom Voice com custo 60-95% menor pela nossa plataforma de agregação. Fornecemos uma interface de API unificada, então você não precisa de contas separadas por provedor: uma única chave para acessar todos os modelos.
Cria uma voz personalizada a partir de uma amostra de áudio: envie de 5 a 30 segundos de áudio limpo de um único locutor (.mp3/.wav/.mp4/.mov) ou referencie um ID de vídeo histórico. A voz resultante pode ser usada no Kling TTS e nos modelos de Lip-Sync.
Depois de clonada, selecione essa voz no Kling TTS ou no Kling Lip-Sync TTS para sintetizar a fala, fazendo com que um humano digital ou uma narração fale com a sua voz exclusiva, e então combine com o vídeo de sincronização labial.
O Kling Custom Voice suporta: Custom Voice, Audio Upload, Video Reference, For TTS/Lip Sync. Consulte a documentação da API Models para todos os parâmetros e exemplos de chamada.
Sim. A API Models expõe o Kling Custom Voice por uma única API unificada e uma só chave, sem contas separadas por provedor e sem precisar lidar com o acesso de rede regional de cada provedor.
Aceitamos Stripe (Visa, Mastercard e outros cartões internacionais) e Alipay. O saldo fica disponível imediatamente após o pagamento.