ZaiGratuit

Glm 4.7 Flash

Nom du modèle API: glm-4.7-flash

Glm 4.7 Flash est le modèle de chat de Zai, servi sur l'API unifiée d'Api.Airforce. Il dispose d'une fenêtre de contexte de 131K tokens. Ses capacités incluent Appel d'outils. Il est disponible sur l'offre gratuite, sans coût par token. Date de coupure des connaissances : 2025-04. Accédez-y via l'API compatible OpenAI avec une seule clé, aux côtés de plus de 65 autres modèles sur Api.Airforce.

Tarifs

Entrée / 1M tokens
Gratuit
Sortie / 1M tokens
Gratuit

Spécifications

Fournisseur
Zai
Type
modèle de chat
Fenêtre de contexte
131K tokens
Sortie maximale
8K tokens
Date de coupure des connaissances
2025-04
Entrée
text
Sortie
text

Capacités

Appel d'outilsStreaming

Utiliser Glm 4.7 Flash via l'API

Compatible OpenAI — pointez n'importe quel SDK OpenAI vers https://api.airforce/v1 et passez glm-4.7-flash comme modèle.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-4.7-flash",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="glm-4.7-flash",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "glm-4.7-flash",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Performances en temps réel

Débit et latence réels sur l'ensemble des fournisseurs servant ce modèle.

Chargement des métriques en temps réel…

Modèles associés