GoogleBezahltBetriebsbereit

Gemini 2.5 Flash

API-Modellname: gemini-2.5-flash

Gemini 2.5 Flash ist das Chat-Modell von Google, bereitgestellt über die einheitliche API von Api.Airforce. Es verfügt über ein Kontextfenster von 1M Tokens. Neben Text akzeptiert es image, audio, video, document als Eingabe. Zu den Funktionen gehören Vision, Tool Calling, Reasoning, Dokumente, Prompt-Caching. Es kostet 0,35 € pro Million Eingabe-Tokens und 2,19 € pro Million Ausgabe-Tokens. Das liegt unter dem offiziellen Eingabepreis des Anbieters von 0,66 €. Wissensstand: 2025-01. Greife über die OpenAI-kompatible API mit einem einzigen Schlüssel darauf zu — zusammen mit über 65 weiteren Modellen auf Api.Airforce.

Preise

Eingabe / 1M Tokens
≈ 0,35 €
Ausgabe / 1M Tokens
≈ 2,19 €
Offizieller Eingabepreis
≈ 0,66 €
Offizieller Ausgabepreis
≈ 3,93 €

Api.Airforce-Preis im Vergleich zum offiziellen Preis des Anbieters.

Spezifikationen

Anbieter
Google
Typ
Chat-Modell
Kontextfenster
1M Tokens
Maximale Ausgabe
66K Tokens
Wissensstand
2025-01
Eingabe
text, image, audio, video, document
Ausgabe
text
Prompt-Caching
Unterstützt

Funktionen

VisionTool CallingReasoningDokumentePrompt-CachingStreaming

Benchmarks

Unabhängige Bewertungen und gemessene Geschwindigkeit von Artificial Analysis.

Intelligenz-Index
20.6/100
Coding-Index
17.8/100
Mathe-Index
60.3/100
MMLU-Pro81%
GPQA Diamond68%
Humanity's Last Exam5%
LiveCodeBench50%
AIME 202560%
MATH-50093%
Ausgabegeschwindigkeit201.0 tok/s
Zeit bis zum ersten Token0.52 s

Quelle: Benchmark data by Artificial Analysis (artificialanalysis.ai)

Wofür wird Gemini 2.5 Flash verwendet?

  • Chatbots & Assistenten — konversationelle KI, Textentwürfe, Zusammenfassungen und Q&A.
  • Bildverständnis — Fotos, Screenshots, Diagramme und gescannte Dokumente analysieren.
  • Agenten & Automatisierung — Function Calling und Tool Use für mehrstufige Workflows.
  • Komplexes Schlussfolgern — Mathematik, Coding und schrittweises Problemlösen.
  • Dokumentenanalyse — lange Dateien zusammenfassen und Fragen dazu beantworten.
  • Long-Context-Aufgaben — ganze Dokumente oder Codebasen in einem einzigen Prompt verarbeiten.
  • Echtzeit-Erlebnisse — Token streamen für reaktionsschnelle Chats und Apps.

Gemini 2.5 Flash vs. ähnliche Modelle

ModellIntelligenzKontextInput / 1MOutput / 1M
Gemini 2.5 Flash20.61M0,35 €2,19 €
Gemini 2.5 Pro34.62M0,61 €1,92 €
Gemini 3 Flash35.01M0,35 €2,10 €
Gemini 3 Pro48.42M0,79 €2,40 €

Preise sind Api.Airforce Pay-as-you-go-Tarife pro 1M Token. Der Kontext ist die maximale Eingabelänge.

Verwandte Modelle

Gemini 2.5 Flash — häufig gestellte Fragen

Was kostet Gemini 2.5 Flash?
Gemini 2.5 Flash wird Pay-as-you-go abgerechnet: 0,35 € pro 1M Input-Token und 2,19 € pro 1M Output-Token. Kein Abonnement — du zahlst nur, was du verwendest.
Wie groß ist das Kontextfenster von Gemini 2.5 Flash?
Gemini 2.5 Flash unterstützt ein Kontextfenster von bis zu 1M Token. Es können bis zu 66K Token in einer einzigen Antwort zurückgegeben werden.
Was kann Gemini 2.5 Flash?
Gemini 2.5 Flash unterstützt Vision, Tool Calling, Reasoning, Dokumente, Prompt-Caching.
Ist Gemini 2.5 Flash kostenlos nutzbar?
Gemini 2.5 Flash ist ein kostenpflichtiges Pay-as-you-go-Modell — kein Abonnement, du wirst nur für die tatsächliche Nutzung berechnet.
Wie verwende ich Gemini 2.5 Flash über die API?
Gemini 2.5 Flash ist OpenAI-kompatibel. Richte ein beliebiges OpenAI SDK auf https://api.airforce/v1 aus und übergib die Modell-ID gemini-2.5-flash zusammen mit deinem Api.Airforce API-Key.
Von wem stammt Gemini 2.5 Flash?
Gemini 2.5 Flash ist das Chat-Modell von Google, bereitgestellt über das einheitliche Api.Airforce-Gateway neben 100+ weiteren Modellen.