LS
Kling (可灵) 对口型 API
高级对口型视频生成。先识别人脸,再同步自定义音频。
快速开始
1
从控制台获取 API 密钥2
调用人脸识别获取 session_id 和 face_id3
调用对口型接口,传入 session_id 和 face_choose 数组4
轮询获取合成视频结果认证方式
在所有请求中添加 Bearer Token 认证头:
Authorization: Bearer YOUR_API_KEY
可用模型
| 模型 | API 名称 | 特性 | 价格 (8.5折) |
|---|---|---|---|
| 人脸识别 | kling-identify-face | 检测视频人脸,返回 session_id + face_id | $0.0007/次 |
| 高级对口型 | kling-advanced-lip-sync | 人脸音频同步,支持多人脸 | $0.0063/5秒 |
定价 (8.5折)
| 操作 | 价格 |
|---|---|
| 人脸识别 (kling-identify-face) | $0.0007/次 |
| 高级对口型 (kling-advanced-lip-sync) | $0.0063/5秒 |
接口端点
POST
/api/v1/audio/generations创建人脸识别或对口型任务。将 model 设为 "kling-identify-face" 或 "kling-advanced-lip-sync"。
GET
/api/v1/audio/generations?task_id=xxx查询任务状态并获取结果
两步流程说明
对口型需要两次 API 调用。首先,将视频提交给 "kling-identify-face",返回 session_id 和检测到的人脸列表(含 face_id)。然后,向 "kling-advanced-lip-sync" 提交第二次请求,传入 session_id、要同步的 face_id 及对应音频来源。
请求参数
第一步 — 人脸识别 (kling-identify-face)
提交视频以识别人脸。返回 session_id 和人脸对象列表(包含 face_id)。
model必填string
"kling-identify-face"
video_idstring
可灵视频 ID(30天内)。video_id 和 video_url 二选一。
video_urlstring
视频 URL(MP4/MOV,<=500MB)。video_id 和 video_url 二选一。
callback_urlstring
完成后的回调 URL
第二步 — 高级对口型 (kling-advanced-lip-sync)
使用第一步返回的 session_id 和 face_id,传入自定义音频完成对口型合成。
model必填string
"kling-advanced-lip-sync"
session_id必填string
来自人脸识别结果的 session_id
face_choose必填array
人脸配置数组(见下方说明)
callback_urlstring
完成后的回调 URL
face_choose 对象字段
face_id必填string
来自人脸识别结果的 face_id
audio_idstring
可灵音频资产 ID。audio_id 和 sound_file 二选一。
sound_filestring
音频文件 URL(MP3/WAV)。audio_id 和 sound_file 二选一。
start_timenumber
开始时间(秒,默认 0)
end_timenumber
结束时间(秒,默认视频时长)
modestring
"autocut"(截断音频适配视频)或 "loop"(循环音频)
代码示例
# Step 1: Identify faces in the video
curl -X POST https://apimodels.app/api/v1/audio/generations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "kling-identify-face",
"video_url": "https://example.com/video.mp4"
}'响应格式
创建任务响应
{
"code": 200,
"msg": "success",
"data": {
"taskId": "clxxx...",
"state": "pending",
"model": "kling-identify-face"
}
}人脸识别 — 成功响应
{
"code": 200,
"msg": "success",
"data": {
"taskId": "clxxx...",
"state": "completed",
"model": "kling-identify-face",
"faceData": {
"session_id": "session_abc123",
"face_list": [
{
"face_id": "face_001",
"face_reference": "https://...face_thumbnail.jpg"
}
]
}
}
}对口型 — 成功响应
{
"code": 200,
"msg": "success",
"data": {
"taskId": "clxxx...",
"state": "completed",
"model": "kling-advanced-lip-sync",
"resultUrls": ["https://...lip_synced_video.mp4"]
}
}失败响应
{
"code": 200,
"msg": "success",
"data": {
"taskId": "clxxx...",
"state": "failed",
"failMsg": "Face detection failed: no faces found"
}
}任务状态
pending任务已排队,等待处理processing任务执行中completed任务成功完成failed任务失败错误码
400请求错误 - 参数缺失或无效401未授权 - API 密钥无效402余额不足 - 积分不够404未找到 - 任务 ID 不存在500服务器内部错误注意事项
- *两步流程:必须先调用人脸识别获取 session_id
- *第二步需要第一步返回的 session_id 和 face_id
- *face_choose 支持多个人脸,每个人脸可配置独立的音频和时间段
- *结果文件保存 7 天,请及时下载视频
- *对口型按输出视频每 5 秒计费,$0.0063/5s
- *建议每 5-10 秒轮询一次任务状态