GooglePayantOpérationnel

Gemini 3.5 Flash

Nom du modèle API: gemini-3.5-flash

Gemini 3.5 Flash est le modèle de chat de Google, servi sur l'API unifiée d'Api.Airforce. Il dispose d'une fenêtre de contexte de 128K tokens. Au-delà du texte, il accepte image, video, file, audio en entrée. Ses capacités incluent Vision, Appel d'outils, Raisonnement, Documents, Mise en cache des prompts. Il est facturé 1,03 € par million de tokens en entrée et 6,19 € par million de tokens en sortie. C'est inférieur au tarif d'entrée officiel de 1,29 € du fournisseur. Accédez-y via l'API compatible OpenAI avec une seule clé, aux côtés de plus de 65 autres modèles sur Api.Airforce.

Tarifs

Entrée / 1M tokens
≈ 1,03 €
Sortie / 1M tokens
≈ 6,19 €
Tarif d'entrée officiel
≈ 1,29 €

Tarif Api.Airforce comparé au tarif officiel du fournisseur.

Spécifications

Fournisseur
Google
Type
modèle de chat
Fenêtre de contexte
128K tokens
Sortie maximale
66K tokens
Entrée
text, image, video, file, audio
Sortie
text

Capacités

VisionAppel d'outilsRaisonnementDocumentsMise en cache des promptsStreaming

Utiliser Gemini 3.5 Flash via l'API

Compatible OpenAI — pointez n'importe quel SDK OpenAI vers https://api.airforce/v1 et passez gemini-3.5-flash comme modèle.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.5-flash",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "gemini-3.5-flash",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Performances en temps réel

Débit et latence réels sur l'ensemble des fournisseurs servant ce modèle.

Chargement des métriques en temps réel…

Modèles associés