GoogleBezahltBetriebsbereit

Gemini 3.1 Flash Lite

API-Modellname: gemini-3.1-flash-lite

Gemini 3.1 Flash Lite ist das Chat-Modell von Google, bereitgestellt über die einheitliche API von Api.Airforce. Es verfügt über ein Kontextfenster von 1M Tokens. Neben Text akzeptiert es image, audio, video, document als Eingabe. Zu den Funktionen gehören Vision, Tool Calling, Dokumente, Prompt-Caching. Es kostet 0,12 € pro Million Eingabe-Tokens und 0,66 € pro Million Ausgabe-Tokens. Das liegt unter dem offiziellen Eingabepreis des Anbieters von 0,22 €. Wissensstand: 2026-03. Greife über die OpenAI-kompatible API mit einem einzigen Schlüssel darauf zu — zusammen mit über 65 weiteren Modellen auf Api.Airforce.

Preise

Eingabe / 1M Tokens
≈ 0,12 €
Ausgabe / 1M Tokens
≈ 0,66 €
Cache-Lesen / 1M Tokens
≈ 0,02 €
Offizieller Eingabepreis
≈ 0,22 €
Offizieller Ausgabepreis
≈ 1,31 €

Api.Airforce-Preis im Vergleich zum offiziellen Preis des Anbieters.

Spezifikationen

Anbieter
Google
Typ
Chat-Modell
Kontextfenster
1M Tokens
Maximale Ausgabe
33K Tokens
Wissensstand
2026-03
Eingabe
text, image, audio, video, document
Ausgabe
text
Prompt-Caching
Unterstützt

Funktionen

VisionTool CallingDokumentePrompt-CachingStreaming

Benchmarks

Unabhängige Bewertungen und gemessene Geschwindigkeit von Artificial Analysis.

Intelligenz-Index
33.5/100
Coding-Index
30.1/100
GPQA Diamond82%
Humanity's Last Exam16%
Ausgabegeschwindigkeit325.2 tok/s
Zeit bis zum ersten Token5.23 s

Quelle: Benchmark data by Artificial Analysis (artificialanalysis.ai)

Wofür wird Gemini 3.1 Flash Lite verwendet?

  • Chatbots & Assistenten — konversationelle KI, Textentwürfe, Zusammenfassungen und Q&A.
  • Bildverständnis — Fotos, Screenshots, Diagramme und gescannte Dokumente analysieren.
  • Agenten & Automatisierung — Function Calling und Tool Use für mehrstufige Workflows.
  • Dokumentenanalyse — lange Dateien zusammenfassen und Fragen dazu beantworten.
  • Long-Context-Aufgaben — ganze Dokumente oder Codebasen in einem einzigen Prompt verarbeiten.
  • Echtzeit-Erlebnisse — Token streamen für reaktionsschnelle Chats und Apps.

Gemini 3.1 Flash Lite vs. ähnliche Modelle

ModellIntelligenzKontextInput / 1MOutput / 1M
Gemini 3.1 Flash Lite33.51M0,12 €0,66 €
Gemini 2.5 Flash20.61M0,35 €2,19 €
Gemini 2.5 Pro34.62M0,61 €1,92 €
Gemini 3 Flash35.01M0,35 €2,10 €

Preise sind Api.Airforce Pay-as-you-go-Tarife pro 1M Token. Der Kontext ist die maximale Eingabelänge.

Verwandte Modelle

Gemini 3.1 Flash Lite — häufig gestellte Fragen

Was kostet Gemini 3.1 Flash Lite?
Gemini 3.1 Flash Lite wird Pay-as-you-go abgerechnet: 0,12 € pro 1M Input-Token und 0,66 € pro 1M Output-Token. Kein Abonnement — du zahlst nur, was du verwendest.
Wie groß ist das Kontextfenster von Gemini 3.1 Flash Lite?
Gemini 3.1 Flash Lite unterstützt ein Kontextfenster von bis zu 1M Token. Es können bis zu 33K Token in einer einzigen Antwort zurückgegeben werden.
Was kann Gemini 3.1 Flash Lite?
Gemini 3.1 Flash Lite unterstützt Vision, Tool Calling, Dokumente, Prompt-Caching.
Ist Gemini 3.1 Flash Lite kostenlos nutzbar?
Gemini 3.1 Flash Lite ist ein kostenpflichtiges Pay-as-you-go-Modell — kein Abonnement, du wirst nur für die tatsächliche Nutzung berechnet.
Wie verwende ich Gemini 3.1 Flash Lite über die API?
Gemini 3.1 Flash Lite ist OpenAI-kompatibel. Richte ein beliebiges OpenAI SDK auf https://api.airforce/v1 aus und übergib die Modell-ID gemini-3.1-flash-lite zusammen mit deinem Api.Airforce API-Key.
Von wem stammt Gemini 3.1 Flash Lite?
Gemini 3.1 Flash Lite ist das Chat-Modell von Google, bereitgestellt über das einheitliche Api.Airforce-Gateway neben 100+ weiteren Modellen.