Modelle

Alle verfügbaren Modelle mit Preisen und Echtzeitstatus durchsuchen.

246

Modelle gesamt

38

Kostenlos

Gedrosselte Rate-Limits

208

Alle Pläne

In jedem bezahlten Plan und Pay2Go enthalten

RPM = Anfragen pro Minute · RPD = Anfragen pro Tag

Preise werden getrennt für Input und Output pro 1 Million Tokens angezeigt.

1K = 1.000 (Tausend) · 1M = 1.000.000 (Million)

Status-Legende

Betriebsbereit

Letzte Probe erfolgreich mit normaler Latenz oder ≥ 80 % des aktuellen Live-Traffics erfolgreich.

Eingeschränkt

Latenz über dem Schwellenwert (standardmäßig ≥ 10 s) oder 50–80 % des aktuellen Live-Traffics erfolgreich.

Teilausfall

Gerade zwischen verfügbar und nicht verfügbar gewechselt oder 20–50 % des aktuellen Live-Traffics erfolgreich.

Schwerer Ausfall

Zwei aufeinanderfolgende fehlgeschlagene Probes (~10 Min.) oder unter 20 % des aktuellen Live-Traffics erfolgreich.

Probes werden alle 5 Minuten ausgeführt. Ergebnisse aus dem Live-Betrieb (5xx, 429, Verbindungsfehler) überschreiben die Probe innerhalb eines gleitenden Fensters von 20 Anfragen für höhere Genauigkeit.

Free-Modelle & Rate-Limits

Free-Modelle können einen 429-Fehler "Rate Limit überschritten" zurückgeben, auch wenn der Status Betriebsbereit anzeigt. Dies ist das planbasierte Durchsatzlimit (Anfragen pro Minute / Tag) – kein Modellausfall. Abonniere einen Plan oder lade dein Pay-as-you-Go-Guthaben auf, um das Limit aufzuheben.

Audio-, Video- & ratesensitive Modelle

Einige Routen (Text-to-Speech, Musik, Voice Cloning, Video, Dubbing und einige ratesensitive Free-Chat-Modelle) können nicht sicher geprobt werden, ohne Kontingent zu verbrauchen. Sie werden standardmäßig als Betriebsbereit angezeigt; die tatsächliche Verfügbarkeit erscheint in den 7-Tage-Uptime-Balken, sobald echter Traffic durchläuft.

246 Modelle gefunden (239 Gruppen)