xAIPayant

Grok 4.1 Fast Non Reasoning

Nom du modèle API: grok-4.1-fast-non-reasoning

Grok 4.1 Fast Non Reasoning est le modèle de chat de xAI, servi sur l'API unifiée d'Api.Airforce. Il dispose d'une fenêtre de contexte de 2M tokens. Au-delà du texte, il accepte image en entrée. Ses capacités incluent Vision, Appel d'outils, Mise en cache des prompts. Il est facturé 0,15 € par million de tokens en entrée et 0,15 € par million de tokens en sortie. C'est inférieur au tarif d'entrée officiel de 0,17 € du fournisseur. Date de coupure des connaissances : 2025-09. Accédez-y via l'API compatible OpenAI avec une seule clé, aux côtés de plus de 65 autres modèles sur Api.Airforce.

Tarifs

Entrée / 1M tokens
≈ 0,15 €
Sortie / 1M tokens
≈ 0,15 €
Tarif d'entrée officiel
≈ 0,17 €

Tarif Api.Airforce comparé au tarif officiel du fournisseur.

Spécifications

Fournisseur
xAI
Type
modèle de chat
Fenêtre de contexte
2M tokens
Sortie maximale
33K tokens
Date de coupure des connaissances
2025-09
Entrée
text, image
Sortie
text

Capacités

VisionAppel d'outilsMise en cache des promptsStreaming

Utiliser Grok 4.1 Fast Non Reasoning via l'API

Compatible OpenAI — pointez n'importe quel SDK OpenAI vers https://api.airforce/v1 et passez grok-4.1-fast-non-reasoning comme modèle.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-4.1-fast-non-reasoning",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="grok-4.1-fast-non-reasoning",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "grok-4.1-fast-non-reasoning",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Performances en temps réel

Débit et latence réels sur l'ensemble des fournisseurs servant ce modèle.

Chargement des métriques en temps réel…

Modèles associés