モデル
利用可能なすべてのモデル、その料金、リアルタイムステータスを閲覧。
246
モデル合計
38
無料
制限されたレート制限
208
全プラン
すべての有料ティアと Pay2Go で利用可能
RPM = 1 分あたりのリクエスト数 · RPD = 1 日あたりのリクエスト数
料金は 100 万トークンあたりの入力と出力で個別に表示されます。
1K = 1,000(千) · 1M = 1,000,000(百万)
稼働中
最終プローブが正常なレイテンシで成功、または最近のライブトラフィックの80%以上が成功。
劣化
レイテンシが閾値(デフォルト10秒以上)を超えているか、最近のライブトラフィックの50〜80%が成功。
部分障害
稼働と停止の間を遷移中、または最近のライブトラフィックの20〜50%が成功。
重大障害
連続2回のプローブ失敗(約10分)、または最近のライブトラフィックの成功率が20%未満。
プローブは5分ごとに実行されます。ライブリクエストの結果(5xx・429・接続エラー)は精度向上のため20リクエストのローリングウィンドウ内でプローブを上書きします。
無料モデルとレート制限
バッジが「稼働中」でも、無料モデルは 429「レート制限超過」エラーを返すことがあります。これはモデルの障害ではなく、プランごとのスループット上限(リクエスト数/分・日)によるものです。制限を解除するにはサブスクリプションを購入するか、Pay2Go 残高をチャージしてください。
音声・動画・レートに敏感なモデル
一部のルート(テキスト読み上げ・音楽・ボイスクローン・動画・吹き替え・レートに敏感な一部の無料チャットモデル)はクォータを消費せずに安全にプローブできません。これらはデフォルトで「稼働中」と表示されますが、実際のトラフィックが流れると7日間の稼働率バーに実際の可用性が反映されます。