Modelli
Visualizza tutti i modelli disponibili, i loro prezzi e lo stato in tempo reale.
246
Totale modelli
38
Gratuito
Limiti di frequenza ridotti
208
Tutti i piani
Disponibile su ogni tier a pagamento e Pay2Go
RPM = Richieste al minuto · RPD = Richieste al giorno
I prezzi sono mostrati separatamente per input e output per 1 milione di token.
1K = 1.000 (mille) · 1M = 1.000.000 (milione)
Operativo
L'ultimo probe è riuscito con latenza normale, o ≥ 80% del traffico live recente ha avuto successo.
Degradato
Latenza superiore alla soglia (≥ 10s per impostazione predefinita) o il 50–80% del traffico live recente ha avuto successo.
Disservizio parziale
Appena passato tra attivo e inattivo, o il 20–50% del traffico live recente ha avuto successo.
Disservizio grave
Due probe falliti consecutivi (~10 min), o meno del 20% del traffico live recente ha avuto successo.
I probe vengono eseguiti ogni 5 minuti. I risultati del traffico live reale (5xx, 429, errori di connessione) sovrascrivono il probe in una finestra mobile di 20 richieste per una maggiore precisione.
Modelli gratuiti e limiti di frequenza
I modelli gratuiti possono restituire un errore 429 "limite di frequenza superato" anche quando il badge è Operativo. Si tratta del limite di throughput per piano (richieste al minuto / al giorno) — non di un'interruzione del modello. Abbonati o ricarica il saldo pay-as-you-go per rimuovere il limite.
Modelli audio, video e sensibili alla frequenza
Alcune route (text-to-speech, musica, clonazione vocale, video, doppiaggio e alcuni modelli di chat gratuiti sensibili alla frequenza) non possono essere verificate in sicurezza senza consumare quota. Vengono mostrate come Operative per impostazione predefinita; la loro disponibilità reale appare nelle barre di uptime a 7 giorni una volta che il traffico reale le attraversa.