
rh-lip-sync-videoKling Lip-Sync Video does frame-level lip synchronization, aligning an audio track to the mouth movements of a character in a video — real humans, 3D and 2D animated characters — with local audio upload or online TTS and minute-level duration. The typical flow is to run Kling Face Recognition first to get a faceId, then align audio (uploaded or from Kling Lip-Sync TTS) to that face. Ideal for digital-human voiceover, dub-to-lip-sync and talking animated characters.
Precise lip-audio alignment
Real human, 3D, 2D support
Upload or online TTS
Minute-level video generation
Kling lip-sync is a 3-step flow — run them in order; intermediate values carry forward automatically.
Upload or paste a public video URL; recognition returns sessionId + faceId.
Trimmed audio must be ≥2s; the insert window must overlap the face window by ≥2s.
Kling Lip-Sync Video es una API de generación de video de Kling. Kling Lip-Sync Video realiza sincronización labial a nivel de fotograma, alineando una pista de audio con los movimientos de la boca de un personaje en un vídeo —personas reales, personajes animados en 3D y 2D— con subida de audio local o TTS en línea y duración de hasta varios minutos. El flujo habitual es ejecutar primero Kling Face Recognition para obtener un faceId y luego alinear el audio (subido o desde Kling Lip-Sync TTS) con esa cara. Ideal para locución de humanos digitales, doblaje con sincronización labial y personajes animados que hablan. A través de la plataforma API Models puedes acceder a este modelo mediante una API unificada a precios muy por debajo de las tarifas oficiales.
Genera rápidamente videos promocionales de marca para campañas y redes sociales.
Crea contenido de video corto atractivo para TikTok, Instagram y YouTube.
Genera demostraciones de funciones y tutoriales para mejorar la conversión.
Produce explicaciones de cursos, divulgación y videos de formación a bajo coste.
Kling Lip-Sync Video está disponible a través de API Models a precios muy inferiores a las tarifas oficiales. Visita la página del modelo para ver el precio actual.
Regístrate en API Models, obtén tu clave API y llama a nuestro endpoint unificado. Ofrecemos documentación detallada con ejemplos en cURL, Python y Node.js.
API Models ofrece el mismo modelo Kling Lip-Sync Video con un coste 60-95% menor a través de nuestra plataforma de agregación. Proporcionamos una interfaz de API unificada, así que no necesitas cuentas separadas por proveedor: una sola clave para acceder a todos los modelos.
Realiza sincronización labial a nivel de fotograma: ajusta una pista de audio a los movimientos de la boca de un personaje en un vídeo, ya sea persona real o personaje animado en 3D o 2D, con audio subido localmente o TTS en línea y duración de varios minutos. Ideal para locuciones de humanos digitales, doblaje con sincronía labial y personajes animados que hablan.
Flujo habitual: primero ejecuta Kling Face Recognition (kling-identify-face) para detectar un rostro en el vídeo y obtener un faceId; luego ajusta el audio (subido o generado con Kling Lip-Sync TTS) a ese rostro para producir el vídeo con sincronía labial.
Kling Lip-Sync Video admite: Lip Sync, Multi-Character, Audio Alignment, Minute-Level Duration. Consulta la documentación de API Models para ver todos los parámetros y ejemplos de llamada.
Sí. API Models expone Kling Lip-Sync Video mediante una única API unificada y una sola clave, sin cuentas separadas por proveedor ni necesidad de gestionar tú mismo el acceso de red regional de cada proveedor.
Aceptamos Stripe (Visa, Mastercard y otras tarjetas internacionales) y Alipay. El saldo está disponible al instante tras el pago.