xAIDe pagoOperativo

Grok 4.1 Fast

Nombre del modelo en la API: grok-4.1-fast

Grok 4.1 Fast es el modelo de chat de xAI, servido en la API unificada de Api.Airforce. Tiene una ventana de contexto de 2M tokens. Además de texto, acepta image como entrada. Sus capacidades incluyen Visión, Llamada a herramientas, Razonamiento, Caché de prompts. Su precio es de — por millón de tokens de entrada y — por millón de tokens de salida. Eso está por debajo de la tarifa oficial de entrada del proveedor de 0,17 €. Fecha de corte del conocimiento: 2025-09. Accede a él a través de la API compatible con OpenAI con una sola clave, junto a más de 65 modelos más en Api.Airforce.

Precios

Entrada / 1M tokens
Gratuito
Salida / 1M tokens
Gratuito
Tarifa oficial de entrada
≈ 0,17 €

Precio de Api.Airforce frente a la tarifa oficial del proveedor.

Especificaciones

Proveedor
xAI
Tipo
modelo de chat
Ventana de contexto
2M tokens
Salida máxima
33K tokens
Fecha de corte del conocimiento
2025-09
Entrada
text, image
Salida
text

Capacidades

VisiónLlamada a herramientasRazonamientoCaché de promptsStreaming

Usa Grok 4.1 Fast a través de la API

Compatible con OpenAI: apunta cualquier SDK de OpenAI a https://api.airforce/v1 y pasa grok-4.1-fast como modelo.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-4.1-fast",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="grok-4.1-fast",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "grok-4.1-fast",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Rendimiento en vivo

Rendimiento y latencia reales en los proveedores que sirven este modelo.

Cargando métricas en vivo…

Modelos relacionados