Docs/Kling (可灵) 对口型 API

Kling (可灵) 对口型 API

高级对口型视频生成。先识别人脸，再同步自定义音频。

快速开始

从控制台获取 API 密钥

调用人脸识别获取 session_id 和 face_id

调用对口型接口，传入 session_id 和 face_choose 数组

轮询获取合成视频结果

认证方式

在所有请求中添加 Bearer Token 认证头：

Authorization: Bearer YOUR_API_KEY

可用模型

模型	API 名称	特性	价格 (8.5折)
人脸识别	`kling-identify-face`	检测视频人脸，返回 session_id + face_id	$0.0007/次
高级对口型	`kling-advanced-lip-sync`	人脸音频同步，支持多人脸	$0.0063/5秒

定价 (8.5折)

操作	价格
人脸识别 (kling-identify-face)	$0.0007/次
高级对口型 (kling-advanced-lip-sync)	$0.0063/5秒

接口端点

POST/api/v1/audio/generations

创建人脸识别或对口型任务。将 model 设为 "kling-identify-face" 或 "kling-advanced-lip-sync"。

GET/api/v1/audio/generations?task_id=xxx

查询任务状态并获取结果

两步流程说明

对口型需要两次 API 调用。首先，将视频提交给 "kling-identify-face"，返回 session_id 和检测到的人脸列表（含 face_id）。然后，向 "kling-advanced-lip-sync" 提交第二次请求，传入 session_id、要同步的 face_id 及对应音频来源。

请求参数

第一步 — 人脸识别 (kling-identify-face)

提交视频以识别人脸。返回 session_id 和人脸对象列表（包含 face_id）。

model必填string

"kling-identify-face"

video_idstring

可灵视频 ID（30天内）。video_id 和 video_url 二选一。

video_urlstring

视频 URL（MP4/MOV，<=500MB）。video_id 和 video_url 二选一。

callback_urlstring

完成后的回调 URL

第二步 — 高级对口型 (kling-advanced-lip-sync)

使用第一步返回的 session_id 和 face_id，传入自定义音频完成对口型合成。

model必填string

"kling-advanced-lip-sync"

session_id必填string

来自人脸识别结果的 session_id

face_choose必填array

人脸配置数组（见下方说明）

callback_urlstring

完成后的回调 URL

face_choose 对象字段

face_id必填string

来自人脸识别结果的 face_id

audio_idstring

可灵音频资产 ID。audio_id 和 sound_file 二选一。

sound_filestring

音频文件 URL（MP3/WAV）。audio_id 和 sound_file 二选一。

start_timenumber

开始时间（秒，默认 0）

end_timenumber

结束时间（秒，默认视频时长）

modestring

"autocut"（截断音频适配视频）或 "loop"（循环音频）

代码示例

# Step 1: Identify faces in the video
curl -X POST https://apimodels.app/api/v1/audio/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kling-identify-face",
    "video_url": "https://example.com/video.mp4"
  }'

响应格式

创建任务响应

{
  "code": 200,
  "msg": "success",
  "data": {
    "taskId": "clxxx...",
    "state": "pending",
    "model": "kling-identify-face"
  }
}

人脸识别 — 成功响应

{
  "code": 200,
  "msg": "success",
  "data": {
    "taskId": "clxxx...",
    "state": "completed",
    "model": "kling-identify-face",
    "faceData": {
      "session_id": "session_abc123",
      "face_list": [
        {
          "face_id": "face_001",
          "face_reference": "https://...face_thumbnail.jpg"
        }
      ]
    }
  }
}

对口型 — 成功响应

{
  "code": 200,
  "msg": "success",
  "data": {
    "taskId": "clxxx...",
    "state": "completed",
    "model": "kling-advanced-lip-sync",
    "resultUrls": ["https://...lip_synced_video.mp4"]
  }
}

失败响应

{
  "code": 200,
  "msg": "success",
  "data": {
    "taskId": "clxxx...",
    "state": "failed",
    "failMsg": "Face detection failed: no faces found"
  }
}

任务状态

pending任务已排队，等待处理

processing任务执行中

completed任务成功完成

failed任务失败

错误码

400请求错误 - 参数缺失或无效

401未授权 - API 密钥无效

402余额不足 - 积分不够

404未找到 - 任务 ID 不存在

500服务器内部错误

注意事项

*两步流程：必须先调用人脸识别获取 session_id
*第二步需要第一步返回的 session_id 和 face_id
*face_choose 支持多个人脸，每个人脸可配置独立的音频和时间段
*结果文件保存 7 天，请及时下载视频
*对口型按输出视频每 5 秒计费，$0.0063/5s
*建议每 5-10 秒轮询一次任务状态

试用人脸识别获取 API 密钥

Docs/Kling (可灵) 对口型 API

Kling (可灵) 对口型 API

高级对口型视频生成。先识别人脸，再同步自定义音频。

快速开始

从控制台获取 API 密钥

调用人脸识别获取 session_id 和 face_id

调用对口型接口，传入 session_id 和 face_choose 数组

轮询获取合成视频结果

认证方式

在所有请求中添加 Bearer Token 认证头：

Authorization: Bearer YOUR_API_KEY

可用模型

模型	API 名称	特性	价格 (8.5折)
人脸识别	`kling-identify-face`	检测视频人脸，返回 session_id + face_id	$0.0007/次
高级对口型	`kling-advanced-lip-sync`	人脸音频同步，支持多人脸	$0.0063/5秒

定价 (8.5折)

操作	价格
人脸识别 (kling-identify-face)	$0.0007/次
高级对口型 (kling-advanced-lip-sync)	$0.0063/5秒

接口端点

POST/api/v1/audio/generations

创建人脸识别或对口型任务。将 model 设为 "kling-identify-face" 或 "kling-advanced-lip-sync"。

GET/api/v1/audio/generations?task_id=xxx

查询任务状态并获取结果

两步流程说明

请求参数

第一步 — 人脸识别 (kling-identify-face)

提交视频以识别人脸。返回 session_id 和人脸对象列表（包含 face_id）。

model必填string

"kling-identify-face"

video_idstring

可灵视频 ID（30天内）。video_id 和 video_url 二选一。

video_urlstring

视频 URL（MP4/MOV，<=500MB）。video_id 和 video_url 二选一。

callback_urlstring

完成后的回调 URL

第二步 — 高级对口型 (kling-advanced-lip-sync)

使用第一步返回的 session_id 和 face_id，传入自定义音频完成对口型合成。

model必填string

"kling-advanced-lip-sync"

session_id必填string

来自人脸识别结果的 session_id

face_choose必填array

人脸配置数组（见下方说明）

callback_urlstring

完成后的回调 URL

face_choose 对象字段

face_id必填string

来自人脸识别结果的 face_id

audio_idstring

可灵音频资产 ID。audio_id 和 sound_file 二选一。

sound_filestring

音频文件 URL（MP3/WAV）。audio_id 和 sound_file 二选一。

start_timenumber

开始时间（秒，默认 0）

end_timenumber

结束时间（秒，默认视频时长）

modestring

"autocut"（截断音频适配视频）或 "loop"（循环音频）

代码示例

# Step 1: Identify faces in the video
curl -X POST https://apimodels.app/api/v1/audio/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kling-identify-face",
    "video_url": "https://example.com/video.mp4"
  }'

响应格式

创建任务响应

{
  "code": 200,
  "msg": "success",
  "data": {
    "taskId": "clxxx...",
    "state": "pending",
    "model": "kling-identify-face"
  }
}

人脸识别 — 成功响应

{
  "code": 200,
  "msg": "success",
  "data": {
    "taskId": "clxxx...",
    "state": "completed",
    "model": "kling-identify-face",
    "faceData": {
      "session_id": "session_abc123",
      "face_list": [
        {
          "face_id": "face_001",
          "face_reference": "https://...face_thumbnail.jpg"
        }
      ]
    }
  }
}

对口型 — 成功响应

{
  "code": 200,
  "msg": "success",
  "data": {
    "taskId": "clxxx...",
    "state": "completed",
    "model": "kling-advanced-lip-sync",
    "resultUrls": ["https://...lip_synced_video.mp4"]
  }
}

失败响应

{
  "code": 200,
  "msg": "success",
  "data": {
    "taskId": "clxxx...",
    "state": "failed",
    "failMsg": "Face detection failed: no faces found"
  }
}

任务状态

pending任务已排队，等待处理

processing任务执行中

completed任务成功完成

failed任务失败

错误码

400请求错误 - 参数缺失或无效

401未授权 - API 密钥无效

402余额不足 - 积分不够

404未找到 - 任务 ID 不存在

500服务器内部错误

注意事项

*两步流程：必须先调用人脸识别获取 session_id
*第二步需要第一步返回的 session_id 和 face_id
*face_choose 支持多个人脸，每个人脸可配置独立的音频和时间段
*结果文件保存 7 天，请及时下载视频
*对口型按输出视频每 5 秒计费，$0.0063/5s
*建议每 5-10 秒轮询一次任务状态

试用人脸识别获取 API 密钥