Gemini 3 Pro Image via GeminiGen channel. Professional asset creation with advanced reasoning and high-fidelity text rendering.
Gemini 3.1 Flash Image via GeminiGen channel. High-performance image generation optimized for speed and high-volume use.
ByteDance
ByteDance Seedance 2 Omni Fast mode. 4-15s flexible duration, multiple aspect ratios, per-second pricing.
ByteDance
ByteDance Seedance 2 Omni Pro mode. 4-15s flexible duration, highest quality, cinematic output.
VEO 3.1 Fast HD (720p) video generation via GeminiGen. 8s fixed duration, 16:9 aspect ratio, reference image support.
VEO 3.1 Fast Full HD (1080p) video generation via GeminiGen. 8s fixed duration, 16:9 aspect ratio, reference image support.
xAI
Official Grok Video 3 via GeminiGen API. Fast generation with customizable resolution, duration (6/10/15s), and reference image support.
RunningHub
VEO 3.1 Fast 4K video generation via RunningHub. Requires start frame image. Supports start-end frame video generation.
SparkPix
Sub 1 second text-to-image model built for production use cases. State-of-the-art speed, quality, and text rendering.
SparkPix
1 秒内完成的多图编辑模型。快速、实惠,支持精准提示词控制、文字渲染和多图编辑。$0.013/张。
Pruna AI
Fast video generation in ~10 seconds. Text/image/audio-to-video with draft mode for 4x faster previews. Built-in audio generation, up to 1080p 48FPS.
xAI
X 平台推出的多模态 AI 模型,根据文本描述生成高质量图像。支持多种尺寸和风格。
xAI
X 平台升级版多模态 AI 模型,更强理解力与生成细节,实现更高精度图像生成。
Seedance
好莱坞级电影视频生成器。双模态 T2V & I2V,支持最多 4 张参考图引导。专业色彩分级、戏剧性光影、平滑运镜。5/10/15 秒,多画幅适配。
ByteDance
字节跳动即梦动作模仿 V2。单图+参考视频精准驱动角色动作,支持多人同框、二次元和宠物,$0.06/秒。
Kling
可灵 AI 对口型视频生成。帧级口型同步,支持真实人物、3D 及 2D 动画角色,支持本地音频和在线配音。
Kling
可灵对口型语音合成。支持多语言多方言、语速调节、情感风格、音色克隆。
Kling
Kling V3 视频 稳定-QN 通道。支持文生视频和图生视频,3-15 秒,可选音频。
Kling
Kling V3 Omni-Video 稳定-QN 通道。多模态输入,支持 image_list、video_list 和保留原声。
经济实惠的 Gemini 3.1 Flash 图片生成。支持文生图和图片编辑,成本更低。
MiniMax
MiniMax M2.5 在编程、工具调用、搜索和办公效率任务上达到或刷新了 SOTA。
Vidu
Vidu Q3 Turbo 快速视频生成。支持文本/图片/首尾帧生成视频,1-16 秒,540p-1080p。
OpenAI
使用更多算力进行深度思考,持续提供更优质的回答。支持多轮模型交互和高级 API 功能。
OpenAI
面向复杂专业工作的前沿模型。
最具性价比的多模态模型,速度最快,适用于高频轻量级任务。
最新 Pro 模型,具备增强推理和多模态能力。
Kling
从音频样本创建自定义声音。上传 .mp3/.wav/.mp4/.mov (5-30秒) 或引用视频 ID。
Kling
将视频中一个或多个人脸与自定义音频同步。支持精确时间控制。
Kling
角色动作控制视频生成。提供参考图片和动作视频,即可创建动画内容。
Kling
视频人脸识别,用于高级唇形同步。返回会话 ID 和人脸 ID。
Anthropic
最新 Opus 模型,具备终极性能和推理能力。
Anthropic
Claude Opus 4.6 扩展思维版,适用于最复杂的推理任务。
Anthropic
最新 Sonnet 模型,具备最佳性能和效率。
Anthropic
Claude Sonnet 4.6 扩展思维版,适用于复杂推理任务。
Kling
Kling AI 图片生成与编辑。支持 1k/2k 分辨率和多图输入,实现创意编辑。
Kling
从文字描述生成音效。3-10 秒音频,自然音质。
Kling
Kling OmniImage 稳定-QN 通道。支持文生图和参考图输入,1K/2K 分辨率。
Kling
为视频自动生成音效和背景音乐。支持 ASMR 模式,打造沉浸式内容。
SeedVR
AI 图片超分辨率增强。可将图片提升至 2K 或 4K 分辨率,高质量细节保留。
Kling
文字转语音,多种声音可选。可调语速,支持多语言。
xAI
万亿参数模型,具备 16-Agent 集群协作、实时数据处理和自我进化能力。
基于 Gemini 3.1 Flash 的快速图片生成。支持文生图和图片编辑,1K/2K/4K 画质。
Minimax
Minimax (海螺) 高清异步 TTS。表现力丰富,韵律自然。支持声音克隆和声音设计。
经济实惠的 Gemini 3.1 Flash 图片编辑。仅支持图生图,1K/2K/4K 画质。
Minimax
Minimax (海螺) 快速经济异步 TTS。支持声音克隆、声音设计和发音词典。
xAI
基于 Grok 4.2 的图片生成与编辑。支持文生图和蒙版修复编辑。
快速高效的多模态模型。适合快速响应和简单任务。
高级多模态推理模型,具备卓越能力。
Gemini 3 Pro 扩展思维版,适用于复杂推理任务。
Doubao
最新 Doubao Seedream 5.0 Lite 图片生成。支持文生图、图片编辑和多图融合,2K/3K 分辨率。
OpenAI
最新 GPT 模型,具备高级推理和增强能力。
OpenAI
GPT-5.2 对话优化版。
Doubao
高质量 Doubao Seedream 4.5 图片生成。支持文生图和图片编辑,2K/4K 分辨率。
Google VEO 3.1 标准模式。优质画质,支持音频生成,5 秒或 8 秒视频输出。
OpenAI
强大模型,性能优异且高效。
OpenAI
GPT-5.1 快照版本,输出可复现。
Anthropic
最新 Opus 模型,具备增强能力和改进推理。
Anthropic
Claude Opus 4.5 扩展思维版,适用于最复杂的推理任务。
OpenAI
GPT-5 集成网络搜索,获取实时信息。
OpenAI
GPT-5 Search API 快照版本,适用于稳定部署。
xAI
最新 Grok 视频模型,音频视频同步生成,10 秒输出。
xAI
基于 Grok 的高质量 5 秒视频生成。支持横屏和竖屏宽高比。
Anthropic
快速且经济的轻量级任务模型。适合简单查询和快速响应。
Anthropic
Claude Haiku 4.5 扩展思维版,适用于复杂推理任务。
OpenAI
通用型模型,适用于各类任务。
Anthropic
最新 Sonnet 模型,性能和效率均有提升。
Anthropic
Claude Sonnet 4.5 扩展思维版,适用于复杂推理任务。
基于 Gemini 3 Pro 的高端图片生成。99% 成功率,最佳画质和可靠性。
基于 Gemini 3 Pro 的高质量图片生成。97% 成功率,支持文生图和图片编辑。
强大的多模态模型,性能优异,适用于复杂任务。
Gemini 2.5 Pro 扩展思维版,适用于复杂推理。
快速且经济的多模态模型。速度与质量的最佳平衡。
Gemini 2.5 Flash 扩展思维版,适用于推理任务。
基于 Gemini 2.5 Flash 的快速图片生成。支持文生图和自然语言图片编辑。
OpenAI
快速推理模型,输出生成高效。
OpenAI
高级推理模型,适用于复杂分析任务。
轻量超快模型。适合简单任务和大批量处理。
Anthropic
最强大的模型,具备卓越的推理和分析能力。
Anthropic
Claude Opus 4 扩展思维版,适用于最复杂的推理任务。
Anthropic
均衡型模型,性能优秀且成本高效。适用于大多数任务。
Anthropic
Claude Sonnet 4 扩展思维版,适用于复杂推理任务。
OpenAI
小型嵌入模型,高效且经济,适用于大多数场景。
OpenAI
大型嵌入模型,精度更高,维度灵活可调。