
kling-custom-voiceKling Custom Voice creates a reusable custom voice from an audio sample — upload 5–30 seconds of clean, single-speaker audio (.mp3/.wav/.mp4/.mov) or reference a historical video ID. The resulting voice can be used in Kling TTS and the Kling Lip-Sync models, so a digital human or narration can speak in your proprietary voice and then be lip-synced to video.
Upload .mp3/.wav/.mp4/.mov samples
Use a historical video ID as source
Create reusable voice profiles
$0.006 per voice creation
Clean single voice, 5-30 seconds, no background noise
Create a custom voice to see the result
Kling Custom Voice es una API de audio y voz de Kling. Kling Custom Voice crea una voz personalizada reutilizable a partir de una muestra de audio: sube de 5 a 30 segundos de audio limpio, de un solo hablante (.mp3/.wav/.mp4/.mov) o referencia el ID de un video histórico. La voz resultante puede usarse en Kling TTS y en los modelos Kling Lip-Sync, de modo que un humano digital o una narración pueda hablar con tu voz propia y luego sincronizarse labialmente con el video. A través de la plataforma API Models puedes acceder a este modelo mediante una API unificada a precios muy por debajo de las tarifas oficiales.
Genera locuciones de nivel profesional para videos, animaciones y anuncios, con voces variadas.
Produce rápidamente el audio de tu pódcast, con soporte para diálogos de varios personajes.
Convierte texto en voz natural y fluida para producir audiolibros.
Doblaje y traducción multilingüe con IA para que tu contenido llegue a audiencias globales.
Kling Custom Voice está disponible a través de API Models a precios muy inferiores a las tarifas oficiales. Visita la página del modelo para ver el precio actual.
Regístrate en API Models, obtén tu clave API y llama a nuestro endpoint unificado. Ofrecemos documentación detallada con ejemplos en cURL, Python y Node.js.
API Models ofrece el mismo modelo Kling Custom Voice con un coste 60-95% menor a través de nuestra plataforma de agregación. Proporcionamos una interfaz de API unificada, así que no necesitas cuentas separadas por proveedor: una sola clave para acceder a todos los modelos.
Crea una voz personalizada a partir de una muestra de audio: sube de 5 a 30 segundos de audio limpio de un solo hablante (.mp3/.wav/.mp4/.mov) o referencia un ID de vídeo histórico. La voz resultante se puede usar en Kling TTS y en los modelos de Lip-Sync.
Una vez clonada, selecciona esa voz en Kling TTS o Kling Lip-Sync TTS para sintetizar el habla, de modo que un humano digital o una narración hable con tu voz exclusiva, y luego combínala con vídeo de sincronización labial.
Kling Custom Voice admite: Custom Voice, Audio Upload, Video Reference, For TTS/Lip Sync. Consulta la documentación de API Models para ver todos los parámetros y ejemplos de llamada.
Sí. API Models expone Kling Custom Voice mediante una única API unificada y una sola clave, sin cuentas separadas por proveedor ni necesidad de gestionar tú mismo el acceso de red regional de cada proveedor.
Aceptamos Stripe (Visa, Mastercard y otras tarjetas internacionales) y Alipay. El saldo está disponible al instante tras el pago.