All

Models/Kling Lip-Sync TTS

Kling Lip-Sync TTS

rh-lip-sync-tts

Kling Lip-Sync TTS is text-to-speech designed for lip-sync, with multi-language and multi-dialect support, speed control, emotion styles and voice cloning. It generates the voice track that feeds directly into Kling Lip-Sync Video for mouth alignment, so you can synthesize emotionally styled speech (optionally in a cloned voice) and sync it to a character's mouth in one workflow.

Text to SpeechMulti-LanguageVoice CloneSpeed Control

per call$0.010/image

Multi-Language

Chinese and English voices

Voice Cloning

Custom voice replication

Speed Control

0.8x to 2x playback speed

Emotion Styles

Multiple voice personas

API Docs

Kling lip-sync is a 3-step flow — run them in order; intermediate values carry forward automatically.

Step 1 · Face Recognition

Source video (MP4/MOV, 2-60s, 720p/1080p, clear face)

Upload

Upload or paste a public video URL; recognition returns sessionId + faceId.

Step 2 · Prepare Audio

Step 3 · Generate Lip-Sync Video

soundStartTime (ms)

soundEndTime (ms)

soundInsertTime (ms)

Trimmed audio must be ≥2s; the insert window must overlap the face window by ≥2s.

Última actualización: 2026-07-02

TL;DR Kling Lip-Sync TTS es un modelo de audio y voz de Kling, accesible mediante la API unificada de API Models (nombre del modelo `rh-lip-sync-tts`). Precio: per call: $0.01. Una sola clave para todos los modelos de imagen / video / LLM / audio.

Acerca de Kling Lip-Sync TTS

Kling Lip-Sync TTS es una API de audio y voz de Kling. Kling Lip-Sync TTS es texto a voz pensado para la sincronización labial, con soporte multilingüe y multidialectal, control de velocidad, estilos de emoción y clonación de voz. Genera la pista de voz que alimenta directamente a Kling Lip-Sync Video para la alineación de la boca, de modo que puedes sintetizar habla con estilo emocional (opcionalmente en una voz clonada) y sincronizarla con la boca de un personaje en un solo flujo de trabajo. A través de la plataforma API Models puedes acceder a este modelo mediante una API unificada con precios de pago por uso transparentes. Precio actual: per call: $0.01.

Características principales

Multi-Language -- Chinese and English voices
Voice Cloning -- Custom voice replication
Speed Control -- 0.8x to 2x playback speed
Emotion Styles -- Multiple voice personas

Casos de uso

Voz en off y narración

Genera locuciones de nivel profesional para videos, animaciones y anuncios, con voces variadas.

Producción de pódcast

Produce rápidamente el audio de tu pódcast, con soporte para diálogos de varios personajes.

Creación de audiolibros

Convierte texto en voz natural y fluida para producir audiolibros.

Doblaje multilingüe

Doblaje y traducción multilingüe con IA para que tu contenido llegue a audiencias globales.

Por qué API Models

API unificada -- Una sola clave para todos los modelos, sin registrarte en varias plataformas
Precios transparentes -- Pago por uso con el precio por llamada publicado en cada página de modelo, ideal para desarrolladores independientes y startups
Acceso instantáneo -- Empieza a usarlo justo después de registrarte, con pago por Stripe y Alipay
Documentación completa -- Documentación de API detallada con ejemplos en cURL, Python y Node.js

Preguntas frecuentes

¿Cuánto cuesta Kling Lip-Sync TTS?

Kling Lip-Sync TTS está disponible a través de API Models a: per call: $0.01. La facturación es de pago por uso: solo pagas por lo que generas.

¿Cómo usar la API de Kling Lip-Sync TTS?

Regístrate en API Models, obtén tu clave API y llama a nuestro endpoint unificado. Ofrecemos documentación detallada con ejemplos en cURL, Python y Node.js.

¿Cuál es la diferencia entre API Models y la API oficial de Kling?

API Models ofrece el mismo modelo Kling Lip-Sync TTS a través de nuestra plataforma de agregación. Proporcionamos una interfaz de API unificada, así que no necesitas cuentas separadas por proveedor: una sola clave para acceder a todos los modelos.

¿Qué es Kling Lip-Sync TTS?

Es un texto a voz diseñado para la sincronización labial: multilingüe y con múltiples dialectos, con control de velocidad, estilos emocionales y clonación de voz. La voz generada se envía directamente a Kling Lip-Sync Video para alinear los labios.

¿Para quién es Kling Lip-Sync TTS?

Para cualquiera que necesite generar la pista de voz de un vídeo con sincronía labial: sintetiza el texto en voz con estilo emocional y al ritmo adecuado (opcionalmente con una voz clonada) y luego la ajusta a la boca de un personaje en el vídeo.

¿Cómo se compara Kling Lip-Sync TTS con otros modelos de audio y voz?

En API Models, Kling Lip-Sync TTS convive con más de 60 modelos bajo una sola clave API y un solo saldo, así que elegir es cuestión de ajuste, no de dependencia. Admite Text to Speech, Multi-Language, Voice Clone, Speed Control y puedes valorarlo en precio y capacidad frente a otros modelos de audio y voz, y cambiar modificando una sola cadena con el nombre del modelo: sin nueva cuenta ni integración. Explora todas las opciones de audio y voz con precios en vivo en apimodels.app/models.

¿Qué puede hacer Kling Lip-Sync TTS?

Kling Lip-Sync TTS admite: Text to Speech, Multi-Language, Voice Clone, Speed Control. Consulta la documentación de API Models para ver todos los parámetros y ejemplos de llamada.

¿Puedo acceder a la API de Kling Lip-Sync TTS desde cualquier lugar?

Sí. API Models expone Kling Lip-Sync TTS mediante una única API unificada y una sola clave, sin cuentas separadas por proveedor ni necesidad de gestionar tú mismo el acceso de red regional de cada proveedor.

¿Qué métodos de pago se admiten?

Aceptamos Stripe (Visa, Mastercard y otras tarjetas internacionales) y Alipay. El saldo está disponible al instante tras el pago.

Models/Kling Lip-Sync TTS

Kling Lip-Sync TTS

rh-lip-sync-tts

Text to SpeechMulti-LanguageVoice CloneSpeed Control

per call$0.010/image

Multi-Language

Chinese and English voices

Voice Cloning

Custom voice replication

Speed Control

0.8x to 2x playback speed

Emotion Styles

Multiple voice personas

API Docs

Kling lip-sync is a 3-step flow — run them in order; intermediate values carry forward automatically.

Step 1 · Face Recognition

Source video (MP4/MOV, 2-60s, 720p/1080p, clear face)

Upload

Upload or paste a public video URL; recognition returns sessionId + faceId.

Step 2 · Prepare Audio

Step 3 · Generate Lip-Sync Video

soundStartTime (ms)

soundEndTime (ms)

soundInsertTime (ms)

Trimmed audio must be ≥2s; the insert window must overlap the face window by ≥2s.

Última actualización: 2026-07-02

Acerca de Kling Lip-Sync TTS

Características principales

Multi-Language -- Chinese and English voices
Voice Cloning -- Custom voice replication
Speed Control -- 0.8x to 2x playback speed
Emotion Styles -- Multiple voice personas

Casos de uso

Voz en off y narración

Genera locuciones de nivel profesional para videos, animaciones y anuncios, con voces variadas.

Producción de pódcast

Produce rápidamente el audio de tu pódcast, con soporte para diálogos de varios personajes.

Creación de audiolibros

Convierte texto en voz natural y fluida para producir audiolibros.

Doblaje multilingüe

Doblaje y traducción multilingüe con IA para que tu contenido llegue a audiencias globales.

Por qué API Models

API unificada -- Una sola clave para todos los modelos, sin registrarte en varias plataformas
Precios transparentes -- Pago por uso con el precio por llamada publicado en cada página de modelo, ideal para desarrolladores independientes y startups
Acceso instantáneo -- Empieza a usarlo justo después de registrarte, con pago por Stripe y Alipay
Documentación completa -- Documentación de API detallada con ejemplos en cURL, Python y Node.js

Preguntas frecuentes

¿Cuánto cuesta Kling Lip-Sync TTS?

Kling Lip-Sync TTS está disponible a través de API Models a: per call: $0.01. La facturación es de pago por uso: solo pagas por lo que generas.

¿Cómo usar la API de Kling Lip-Sync TTS?

Regístrate en API Models, obtén tu clave API y llama a nuestro endpoint unificado. Ofrecemos documentación detallada con ejemplos en cURL, Python y Node.js.

¿Cuál es la diferencia entre API Models y la API oficial de Kling?

¿Qué es Kling Lip-Sync TTS?

¿Para quién es Kling Lip-Sync TTS?

¿Cómo se compara Kling Lip-Sync TTS con otros modelos de audio y voz?

¿Qué puede hacer Kling Lip-Sync TTS?

Kling Lip-Sync TTS admite: Text to Speech, Multi-Language, Voice Clone, Speed Control. Consulta la documentación de API Models para ver todos los parámetros y ejemplos de llamada.

¿Puedo acceder a la API de Kling Lip-Sync TTS desde cualquier lugar?

¿Qué métodos de pago se admiten?

Aceptamos Stripe (Visa, Mastercard y otras tarjetas internacionales) y Alipay. El saldo está disponible al instante tras el pago.

Kling Lip-Sync TTS

Multi-Language

Voice Cloning

Speed Control

Emotion Styles

Step 1 · Face Recognition

Step 2 · Prepare Audio

Step 3 · Generate Lip-Sync Video

Acerca de Kling Lip-Sync TTS

Características principales

Casos de uso

Voz en off y narración

Producción de pódcast

Creación de audiolibros

Doblaje multilingüe

Por qué API Models

Preguntas frecuentes

¿Cuánto cuesta Kling Lip-Sync TTS?

¿Cómo usar la API de Kling Lip-Sync TTS?

¿Cuál es la diferencia entre API Models y la API oficial de Kling?

¿Qué es Kling Lip-Sync TTS?

¿Para quién es Kling Lip-Sync TTS?

¿Cómo se compara Kling Lip-Sync TTS con otros modelos de audio y voz?

¿Qué puede hacer Kling Lip-Sync TTS?

¿Puedo acceder a la API de Kling Lip-Sync TTS desde cualquier lugar?

¿Qué métodos de pago se admiten?

Related models

Kling Lip-Sync TTS

Multi-Language

Voice Cloning

Speed Control

Emotion Styles

Step 1 · Face Recognition

Step 2 · Prepare Audio

Step 3 · Generate Lip-Sync Video

Acerca de Kling Lip-Sync TTS

Características principales

Casos de uso

Voz en off y narración

Producción de pódcast

Creación de audiolibros

Doblaje multilingüe

Por qué API Models

Preguntas frecuentes

¿Cuánto cuesta Kling Lip-Sync TTS?

¿Cómo usar la API de Kling Lip-Sync TTS?

¿Cuál es la diferencia entre API Models y la API oficial de Kling?

¿Qué es Kling Lip-Sync TTS?

¿Para quién es Kling Lip-Sync TTS?

¿Cómo se compara Kling Lip-Sync TTS con otros modelos de audio y voz?

¿Qué puede hacer Kling Lip-Sync TTS?

¿Puedo acceder a la API de Kling Lip-Sync TTS desde cualquier lugar?

¿Qué métodos de pago se admiten?

Related models