ZaiFree

Glm 4.7 Flash

Nome do modelo na API: glm-4.7-flash

Glm 4.7 Flash é o modelo de chat da Zai, disponibilizado na API unificada da Api.Airforce. Ele tem uma janela de contexto de 131K tokens. Os recursos incluem Chamada de ferramentas. Está disponível no plano gratuito sem custo por token. Corte de conhecimento: 2025-04. Acesse-o pela API compatível com OpenAI com uma única chave, junto com mais de 65 outros modelos na Api.Airforce.

Preços

Entrada / 1M tokens
Free
Saída / 1M tokens
Free

Especificações

Provedor
Zai
Tipo
modelo de chat
Janela de contexto
131K tokens
Saída máxima
8K tokens
Corte de conhecimento
2025-04
Entrada
text
Saída
text

Recursos

Chamada de ferramentasStreaming

Use Glm 4.7 Flash pela API

Compatível com OpenAI — aponte qualquer SDK da OpenAI para https://api.airforce/v1 e passe glm-4.7-flash como o modelo.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-4.7-flash",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="glm-4.7-flash",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "glm-4.7-flash",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Desempenho ao vivo

Throughput e latência reais entre os fornecedores que servem este modelo.

Carregando métricas ao vivo…

Modelos relacionados