ByteDance
ByteDance Seedance 2.0 电影级视频生成 —— 直连火山引擎官方 API,稳定、高并发。支持文生、图生、多模态参考生视频,按秒计费 $0.092/s 起。
全能视频 Omni Flash —— 一个模型同时覆盖文生视频与图生视频:纯文本直接生成,或上传 1 张 / 3 张参考图做单图动态化或多图融合(注意:上游不支持 2 张)。支持 720p / 1080p / 4K、4 / 6 / 8 / 10 秒、可选 16:9 / 9:16,按档计费 $0.27 起,4K 档 $0.45 起。
ByteDance
Seedance 2.0 影视版 —— ByteDance Seedance 2.0 的影视级(Cinematic)版本,经 RunningHub 调用。光影、运镜、身份锁定参考的品质明显高于 Ark 直连的 Seedance 2.0 / Fast,代价是生成更慢(通常 60-180 秒,高峰偶尔需要几分钟)。文生 / 图生视频,最多 4 张参考图,5 / 10 / 15 秒,四种宽高比,按时长计费 $1.00 / 5s 起。
ByteDance
Seedance 2.0 Fast —— 直连火山引擎官方 API,提速降价版,稳定高并发。文生 / 图生 / 多模态视频,$0.071/s 起。
ByteDance
字节跳动即梦动作模仿 V2。单图+参考视频精准驱动角色动作,支持多人同框、二次元和宠物,$0.06/秒。
Kling
可灵 AI 对口型视频生成。帧级口型同步,支持真实人物、3D 及 2D 动画角色,支持本地音频和在线配音。
Kling
可灵对口型语音合成。支持多语言多方言、语速调节、情感风格、音色克隆。
Smooth cinematic transitions between a required first frame and required last frame. Outputs 720p or 1080p with native audio. Official stable channel — pricier than V3.1-fast but reliable, ideal for production.
Google VEO 3.1 Lite,基于 OpenAI 风格 /v1/videos 接口。经济实惠,支持参考图,4 秒、6 秒或 8 秒视频输出。
Google VEO 3.1 Lite 4K,基于 OpenAI 风格 /v1/videos 接口。4K 画质,支持参考图,4 秒、6 秒或 8 秒视频输出。
VEO 3.1 Fast HD (720p) video generation via GeminiGen. 8s fixed duration, 16:9 aspect ratio, reference image support.
VEO 3.1 Fast Full HD (1080p) video generation via GeminiGen. 8s fixed duration, 16:9 aspect ratio, reference image support.
xAI
Grok Video 3 via RunningHub rhart-video-g (alias of grok-video-3, same upstream). Per-second pricing $0.01/s, 6-30s output, T2V + I2V supported.
RunningHub
VEO 3.1 Fast 4K video generation via RunningHub. Requires start frame image. Supports start-end frame video generation.
Pruna AI
Fast video generation in ~10 seconds. Text/image/audio-to-video with draft mode for 4x faster previews. Built-in audio generation, up to 1080p 48FPS.
Kling
Kling V3 视频 稳定-QN 通道。支持文生视频和图生视频,3-15 秒,可选音频。
Kling
Kling V3 Omni-Video 稳定-QN 通道。多模态输入,支持 image_list、video_list 和保留原声。
Vidu
Vidu Q3 Turbo 快速视频生成。支持文本/图片/首尾帧生成视频,1-16 秒,540p-1080p。
Kling
角色动作控制视频生成。提供参考图片和动作视频,即可创建动画内容。
Google VEO 3.1 标准模式。优质画质,支持音频生成,5 秒或 8 秒视频输出。
xAI
最新 Grok 视频模型,音频视频同步生成,10 秒输出。
xAI
基于 Grok 的高质量 5 秒视频生成。支持横屏和竖屏宽高比。