GoogleBezahltBetriebsbereit

Gemini 3.1 Flash Lite

API-Modellname: gemini-3.1-flash-lite

Gemini 3.1 Flash Lite ist das Chat-Modell von Google, bereitgestellt über die einheitliche API von Api.Airforce. Es verfügt über ein Kontextfenster von 1M Tokens. Neben Text akzeptiert es image, audio, video, document als Eingabe. Zu den Funktionen gehören Vision, Tool Calling, Dokumente, Prompt-Caching. Es kostet 0,12 € pro Million Eingabe-Tokens und 0,64 € pro Million Ausgabe-Tokens. Das liegt unter dem offiziellen Eingabepreis des Anbieters von 0,21 €. Wissensstand: 2026-03. Greife über die OpenAI-kompatible API mit einem einzigen Schlüssel darauf zu — zusammen mit über 65 weiteren Modellen auf Api.Airforce.

Preise

Eingabe / 1M Tokens
≈ 0,12 €
Ausgabe / 1M Tokens
≈ 0,64 €
Offizieller Eingabepreis
≈ 0,21 €

Api.Airforce-Preis im Vergleich zum offiziellen Preis des Anbieters.

Spezifikationen

Anbieter
Google
Typ
Chat-Modell
Kontextfenster
1M Tokens
Maximale Ausgabe
33K Tokens
Wissensstand
2026-03
Eingabe
text, image, audio, video, document
Ausgabe
text

Funktionen

VisionTool CallingDokumentePrompt-CachingStreaming

Gemini 3.1 Flash Lite über die API nutzen

OpenAI-kompatibel — richte ein beliebiges OpenAI-SDK auf https://api.airforce/v1 und übergib gemini-3.1-flash-lite als Modell.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.1-flash-lite",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="gemini-3.1-flash-lite",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "gemini-3.1-flash-lite",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Live-Performance

Echter Durchsatz und echte Latenz über alle Anbieter, die dieses Modell bereitstellen.

Live-Metriken werden geladen…

Verwandte Modelle