xAIA pagamento

Grok 4.1 Fast Reasoning

Nome del modello API: grok-4.1-fast-reasoning

Grok 4.1 Fast Reasoning è il modello di chat di xAI, servito sull'API unificata di Api.Airforce. Ha una finestra di contesto di 2M token. Oltre al testo, accetta image come input. Le funzionalità includono Visione, Chiamata di strumenti, Ragionamento, Caching dei prompt. Ha un prezzo di 0,43 € per milione di token di input e 0,43 € per milione di token di output. Questo è inferiore alla tariffa input ufficiale del provider di 0,17 €. Data limite delle conoscenze: 2025-09. Accedi tramite l'API compatibile con OpenAI con una sola chiave, insieme a oltre 65 altri modelli su Api.Airforce.

Prezzi

Input / 1M token
≈ 0,43 €
Output / 1M token
≈ 0,43 €
Tariffa input ufficiale
≈ 0,17 €

Prezzo di Api.Airforce rispetto alla tariffa ufficiale del provider.

Specifiche

Provider
xAI
Tipo
modello di chat
Finestra di contesto
2M token
Output massimo
33K token
Data limite delle conoscenze
2025-09
Input
text, image
Output
text

Funzionalità

VisioneChiamata di strumentiRagionamentoCaching dei promptStreaming

Usa Grok 4.1 Fast Reasoning tramite l'API

Compatibile con OpenAI — punta qualsiasi SDK OpenAI verso https://api.airforce/v1 e passa grok-4.1-fast-reasoning come modello.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-4.1-fast-reasoning",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="grok-4.1-fast-reasoning",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "grok-4.1-fast-reasoning",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Prestazioni in tempo reale

Throughput e latenza reali tra i fornitori che servono questo modello.

Caricamento delle metriche in tempo reale…

Modelli correlati