
rh-lip-sync-ttsKling Lip-Sync TTS is text-to-speech designed for lip-sync, with multi-language and multi-dialect support, speed control, emotion styles and voice cloning. It generates the voice track that feeds directly into Kling Lip-Sync Video for mouth alignment, so you can synthesize emotionally styled speech (optionally in a cloned voice) and sync it to a character's mouth in one workflow.
Chinese and English voices
Custom voice replication
0.8x to 2x playback speed
Multiple voice personas
Kling lip-sync is a 3-step flow — run them in order; intermediate values carry forward automatically.
Upload or paste a public video URL; recognition returns sessionId + faceId.
Trimmed audio must be ≥2s; the insert window must overlap the face window by ≥2s.
Kling Lip-Sync TTS es una API de audio y voz de Kling. Kling Lip-Sync TTS es texto a voz pensado para la sincronización labial, con soporte multilingüe y multidialectal, control de velocidad, estilos de emoción y clonación de voz. Genera la pista de voz que alimenta directamente a Kling Lip-Sync Video para la alineación de la boca, de modo que puedes sintetizar habla con estilo emocional (opcionalmente en una voz clonada) y sincronizarla con la boca de un personaje en un solo flujo de trabajo. A través de la plataforma API Models puedes acceder a este modelo mediante una API unificada a precios muy por debajo de las tarifas oficiales.
Genera locuciones de nivel profesional para videos, animaciones y anuncios, con voces variadas.
Produce rápidamente el audio de tu pódcast, con soporte para diálogos de varios personajes.
Convierte texto en voz natural y fluida para producir audiolibros.
Doblaje y traducción multilingüe con IA para que tu contenido llegue a audiencias globales.
Kling Lip-Sync TTS está disponible a través de API Models a precios muy inferiores a las tarifas oficiales. Visita la página del modelo para ver el precio actual.
Regístrate en API Models, obtén tu clave API y llama a nuestro endpoint unificado. Ofrecemos documentación detallada con ejemplos en cURL, Python y Node.js.
API Models ofrece el mismo modelo Kling Lip-Sync TTS con un coste 60-95% menor a través de nuestra plataforma de agregación. Proporcionamos una interfaz de API unificada, así que no necesitas cuentas separadas por proveedor: una sola clave para acceder a todos los modelos.
Es un texto a voz diseñado para la sincronización labial: multilingüe y con múltiples dialectos, con control de velocidad, estilos emocionales y clonación de voz. La voz generada se envía directamente a Kling Lip-Sync Video para alinear los labios.
Para cualquiera que necesite generar la pista de voz de un vídeo con sincronía labial: sintetiza el texto en voz con estilo emocional y al ritmo adecuado (opcionalmente con una voz clonada) y luego la ajusta a la boca de un personaje en el vídeo.
Kling Lip-Sync TTS admite: Text to Speech, Multi-Language, Voice Clone, Speed Control. Consulta la documentación de API Models para ver todos los parámetros y ejemplos de llamada.
Sí. API Models expone Kling Lip-Sync TTS mediante una única API unificada y una sola clave, sin cuentas separadas por proveedor ni necesidad de gestionar tú mismo el acceso de red regional de cada proveedor.
Aceptamos Stripe (Visa, Mastercard y otras tarjetas internacionales) y Alipay. El saldo está disponible al instante tras el pago.