Grok 4.1 Fast Non Reasoning
Nome do modelo na API: grok-4.1-fast-non-reasoning
Grok 4.1 Fast Non Reasoning é o modelo de chat da xAI, disponibilizado na API unificada da Api.Airforce. Ele tem uma janela de contexto de 2M tokens. Além de texto, ele aceita image como entrada. Os recursos incluem Visão, Chamada de ferramentas, Cache de prompts. Tem o preço de 0,15 € por milhão de tokens de entrada e 0,15 € por milhão de tokens de saída. Isso fica abaixo da taxa oficial de entrada de 0,17 € do provedor. Corte de conhecimento: 2025-09. Acesse-o pela API compatível com OpenAI com uma única chave, junto com mais de 65 outros modelos na Api.Airforce.
Preços
Preço da Api.Airforce em comparação com a taxa oficial do provedor.
Especificações
- Provedor
- xAI
- Tipo
- modelo de chat
- Janela de contexto
- 2M tokens
- Saída máxima
- 33K tokens
- Corte de conhecimento
- 2025-09
- Entrada
- text, image
- Saída
- text
Recursos
Use Grok 4.1 Fast Non Reasoning pela API
Compatível com OpenAI — aponte qualquer SDK da OpenAI para https://api.airforce/v1 e passe grok-4.1-fast-non-reasoning como o modelo.
curl https://api.airforce/v1/chat/completions \
-H "Authorization: Bearer $AIRFORCE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-4.1-fast-non-reasoning",
"messages": [{ "role": "user", "content": "Hello!" }]
}'from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
model="grok-4.1-fast-non-reasoning",
messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
model: "grok-4.1-fast-non-reasoning",
messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);Desempenho ao vivo
Throughput e latência reais entre os fornecedores que servem este modelo.