85+ AI 模型 API 对比 & 在线试用

All

Suno v5 音乐生成

Suno

AI music generation — full songs with vocals + lyrics from a one-line idea (inspiration), your own lyrics (custom), or instrumental only. Also sound effects, continue, cover, and voice personas. Each run returns 2 variants.

Songs + VocalsAuto LyricsInstrumentalSound FX2 Variants

$0.26 / per song (2 variants)

试一试

Eleven Flash v2.5

ElevenLabs

可用

超低延迟模型，支持 32 种语言。适合实时对话场景。

Ultra-Fast32 LanguagesLowest Cost

$0.0425 / 1K chars

试一试

Eleven Turbo v2.5

ElevenLabs

可用

高质量低延迟模型，支持 32 种语言。适合对速度有要求的开发场景。

Low Latency32 LanguagesSSML Support

$0.0425 / 1K chars

试一试

Eleven Multilingual v2

ElevenLabs

可用

最逼真、最富情感的模型，支持 29 种语言。适合配音、有声书和后期制作。

High Quality29 LanguagesEmotionally Rich

$0.085 / 1K chars

试一试

Eleven v3

ElevenLabs

可用

最具表现力的模型，支持 70+ 种语言。支持 [laughs]、[whispers] 等音频标签实现情感控制。

70+ LanguagesAudio TagsMost Expressive

$0.085 / 1K chars

试一试

ElevenLabs Dialogue

ElevenLabs

可用

多角色对话生成，自然对话流。适合播客和有声书制作。

Multi-SpeakerNatural FlowConversation

$0.085 / 1K chars

试一试

Voice Isolator

ElevenLabs

可用

从背景噪声、音乐和环境音中提取人声。高质量音频提取。

Noise RemovalSpeech ExtractionAudio Cleanup

$0.102 / min

试一试

AI Dubbing

ElevenLabs

可用

翻译音频/视频并保留情感、节奏和语调。自动唇形同步。

Video Dubbing29 LanguagesPreserve Emotion

$0.2805 / min

试一试

Minimax Speech 2.8 HD

Minimax

可用

MiniMax speech-2.8-hd 最新高保真 TTS,情感语调自然,支持声音克隆与声音设计。$0.07/千字符。

HD QualityEmotion-AwareVoice CloneVoice Design

$0.07 / 1K chars

试一试

Minimax Speech 2.8 Turbo

Minimax

可用

MiniMax speech-2.8-turbo 最新快速经济 TTS,性价比高、多语言强,支持声音克隆与声音设计。$0.04/千字符。

FastCost-EffectiveVoice CloneVoice Design

$0.04 / 1K chars

试一试

Minimax Speech 02 HD

Minimax

可用

MiniMax speech-02-hd 高保真 TTS,情感语调自然,支持声音克隆与声音设计。$0.07/千字符。

HD QualityEmotion-AwareVoice CloneVoice Design

$0.07 / 1K chars

试一试

Kling Custom Voice

Kling

可用

从音频样本创建自定义声音。上传 .mp3/.wav/.mp4/.mov (5-30秒) 或引用视频 ID。

Custom VoiceAudio UploadVideo ReferenceFor TTS/Lip Sync

$0.006 / per call

试一试

Kling Face Recognition

Kling

可用

视频人脸识别，传入 videoUrl 或 videoId，返回 sessionId 和 faceId，用于可灵对口型视频生成。

Face DetectionVideo InputSession-based

$0.001 / per call

试一试

Kling Sound Effects

Kling

-85%可用

从文字描述生成音效。3-10 秒音频，自然音质。

Text to SFX3-10sSound Effects

$0.030 / per call

试一试

Kling Video-to-Audio

Kling

-85%可用

为视频自动生成音效和背景音乐。支持 ASMR 模式，打造沉浸式内容。

Video DubbingSFX + BGMASMR Mode

$0.003 / per call

试一试

Kling TTS

Kling

-85%可用

文字转语音，多种声音可选。可调语速，支持多语言。

TTSMultiple VoicesSpeed Control

$0.01 / per call

试一试

Minimax Speech 2.6 HD

Minimax

可用

Minimax (海螺) 高清异步 TTS。表现力丰富，韵律自然。支持声音克隆和声音设计。

HD QualityVoice CloneAsync TTS

$0.07 / 1K chars

试一试

Minimax Speech 02 Turbo

Minimax

可用

Minimax (海螺) 快速经济异步 TTS。支持声音克隆、声音设计和发音词典。

FastVoice CloneCost-Effective

$0.04 / 1K chars

试一试

Suno v5 音乐生成

Eleven Flash v2.5

Eleven Turbo v2.5

Eleven Multilingual v2

Eleven v3

ElevenLabs Dialogue

Voice Isolator

AI Dubbing

Minimax Speech 2.8 HD

Minimax Speech 2.8 Turbo

Minimax Speech 02 HD

Kling Custom Voice

Kling Face Recognition

Kling Sound Effects

Kling Video-to-Audio

Kling TTS

Minimax Speech 2.6 HD

Minimax Speech 02 Turbo

Audio Models

Suno v5 音乐生成

Eleven Flash v2.5

Eleven Turbo v2.5

Eleven Multilingual v2

Eleven v3

ElevenLabs Dialogue

Voice Isolator

AI Dubbing

Minimax Speech 2.8 HD

Minimax Speech 2.8 Turbo

Minimax Speech 02 HD

Kling Custom Voice

Kling Face Recognition

Kling Sound Effects

Kling Video-to-Audio

Kling TTS

Minimax Speech 2.6 HD

Minimax Speech 02 Turbo

Audio Models