All
Kling
从音频样本创建自定义声音。上传 .mp3/.wav/.mp4/.mov (5-30秒) 或引用视频 ID。
Kling
将视频中一个或多个人脸与自定义音频同步。支持精确时间控制。
Kling
视频人脸识别,用于高级唇形同步。返回会话 ID 和人脸 ID。
Kling
从文字描述生成音效。3-10 秒音频,自然音质。
Kling
为视频自动生成音效和背景音乐。支持 ASMR 模式,打造沉浸式内容。
Kling
文字转语音,多种声音可选。可调语速,支持多语言。
Minimax
Minimax (海螺) 高清异步 TTS。表现力丰富,韵律自然。支持声音克隆和声音设计。
Minimax
Minimax (海螺) 快速经济异步 TTS。支持声音克隆、声音设计和发音词典。
ElevenLabs
超低延迟模型,支持 32 种语言。适合实时对话场景。
ElevenLabs
高质量低延迟模型,支持 32 种语言。适合对速度有要求的开发场景。
ElevenLabs
最逼真、最富情感的模型,支持 29 种语言。适合配音、有声书和后期制作。
ElevenLabs
最具表现力的模型,支持 70+ 种语言。支持 [laughs]、[whispers] 等音频标签实现情感控制。
ElevenLabs
多角色对话生成,自然对话流。适合播客和有声书制作。
ElevenLabs
从背景噪声、音乐和环境音中提取人声。高质量音频提取。
ElevenLabs
翻译音频/视频并保留情感、节奏和语调。自动唇形同步。