GooglePayantOpérationnel

Gemini 3 Flash

Nom du modèle API: gemini-3-flash

Gemini 3 Flash est le modèle de chat de Google, servi sur l'API unifiée d'Api.Airforce. Il dispose d'une fenêtre de contexte de 1M tokens. Au-delà du texte, il accepte image, audio, video, document en entrée. Ses capacités incluent Vision, Appel d'outils, Raisonnement, Documents, Mise en cache des prompts. Il est facturé 0,13 € par million de tokens en entrée et 0,69 € par million de tokens en sortie. C'est inférieur au tarif d'entrée officiel de 0,43 € du fournisseur. Date de coupure des connaissances : 2026-01. Accédez-y via l'API compatible OpenAI avec une seule clé, aux côtés de plus de 65 autres modèles sur Api.Airforce.

Tarifs

Entrée / 1M tokens
≈ 0,13 €
Sortie / 1M tokens
≈ 0,69 €
Tarif d'entrée officiel
≈ 0,43 €

Tarif Api.Airforce comparé au tarif officiel du fournisseur.

Spécifications

Fournisseur
Google
Type
modèle de chat
Fenêtre de contexte
1M tokens
Sortie maximale
33K tokens
Date de coupure des connaissances
2026-01
Entrée
text, image, audio, video, document
Sortie
text

Capacités

VisionAppel d'outilsRaisonnementDocumentsMise en cache des promptsStreaming

Utiliser Gemini 3 Flash via l'API

Compatible OpenAI — pointez n'importe quel SDK OpenAI vers https://api.airforce/v1 et passez gemini-3-flash comme modèle.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3-flash",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="gemini-3-flash",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "gemini-3-flash",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Performances en temps réel

Débit et latence réels sur l'ensemble des fournisseurs servant ce modèle.

Chargement des métriques en temps réel…

Modèles associés