Modèles
Parcourez tous les modèles disponibles, leurs prix et leur statut en temps réel.
246
Total des modèles
38
Gratuit
Limites de débit réduites
208
Tous les plans
Disponible sur tous les niveaux payants et Pay2Go
RPM = Requêtes par minute · RPD = Requêtes par jour
Les prix sont affichés séparément pour l'input et l'output par million de tokens.
1K = 1 000 (mille) · 1M = 1 000 000 (million)
Opérationnel
Dernière sonde réussie avec une latence normale, ou ≥ 80 % du trafic en temps réel récent a réussi.
Dégradé
Latence au-dessus du seuil (≥ 10 s par défaut), ou 50–80 % du trafic en temps réel récent a réussi.
Panne partielle
Transition entre disponible et indisponible, ou 20–50 % du trafic en temps réel récent a réussi.
Panne majeure
Deux sondes consécutives échouées (~10 min), ou moins de 20 % du trafic en temps réel récent a réussi.
Les sondes s'exécutent toutes les 5 minutes. Les résultats des requêtes en temps réel (5xx, 429, erreurs de connexion) remplacent la sonde dans une fenêtre glissante de 20 requêtes pour une meilleure précision.
Modèles gratuits & limites de débit
Les modèles gratuits peuvent renvoyer une erreur 429 « limite de débit dépassée » même quand le badge indique Opérationnel. Il s'agit du plafond de débit par plan (requêtes par minute / jour) — pas d'une panne du modèle. Abonnez-vous ou rechargez votre solde pay-as-you-go pour lever la limite.
Audio, vidéo & modèles sensibles aux débits
Certaines routes (synthèse vocale, musique, clonage de voix, vidéo, doublage et quelques modèles de chat gratuits sensibles aux débits) ne peuvent pas être sondées sans consommer du quota. Elles s'affichent comme Opérationnelles par défaut ; leur disponibilité réelle apparaît dans les barres d'uptime sur 7 jours dès que du vrai trafic les traverse.