Modelle
Alle verfügbaren Modelle mit Preisen und Echtzeitstatus durchsuchen.
246
Modelle gesamt
38
Kostenlos
Gedrosselte Rate-Limits
208
Alle Pläne
In jedem bezahlten Plan und Pay2Go enthalten
RPM = Anfragen pro Minute · RPD = Anfragen pro Tag
Preise werden getrennt für Input und Output pro 1 Million Tokens angezeigt.
1K = 1.000 (Tausend) · 1M = 1.000.000 (Million)
Betriebsbereit
Letzte Probe erfolgreich mit normaler Latenz oder ≥ 80 % des aktuellen Live-Traffics erfolgreich.
Eingeschränkt
Latenz über dem Schwellenwert (standardmäßig ≥ 10 s) oder 50–80 % des aktuellen Live-Traffics erfolgreich.
Teilausfall
Gerade zwischen verfügbar und nicht verfügbar gewechselt oder 20–50 % des aktuellen Live-Traffics erfolgreich.
Schwerer Ausfall
Zwei aufeinanderfolgende fehlgeschlagene Probes (~10 Min.) oder unter 20 % des aktuellen Live-Traffics erfolgreich.
Probes werden alle 5 Minuten ausgeführt. Ergebnisse aus dem Live-Betrieb (5xx, 429, Verbindungsfehler) überschreiben die Probe innerhalb eines gleitenden Fensters von 20 Anfragen für höhere Genauigkeit.
Free-Modelle & Rate-Limits
Free-Modelle können einen 429-Fehler "Rate Limit überschritten" zurückgeben, auch wenn der Status Betriebsbereit anzeigt. Dies ist das planbasierte Durchsatzlimit (Anfragen pro Minute / Tag) – kein Modellausfall. Abonniere einen Plan oder lade dein Pay-as-you-Go-Guthaben auf, um das Limit aufzuheben.
Audio-, Video- & ratesensitive Modelle
Einige Routen (Text-to-Speech, Musik, Voice Cloning, Video, Dubbing und einige ratesensitive Free-Chat-Modelle) können nicht sicher geprobt werden, ohne Kontingent zu verbrauchen. Sie werden standardmäßig als Betriebsbereit angezeigt; die tatsächliche Verfügbarkeit erscheint in den 7-Tage-Uptime-Balken, sobald echter Traffic durchläuft.