Was kostet Gemini 2.5 Flash?

Gemini 2.5 Flash wird Pay-as-you-go abgerechnet: 0,35 € pro 1M Input-Token und 2,19 € pro 1M Output-Token. Kein Abonnement — du zahlst nur, was du verwendest.

Wie groß ist das Kontextfenster von Gemini 2.5 Flash?

Gemini 2.5 Flash unterstützt ein Kontextfenster von bis zu 1M Token. Es können bis zu 66K Token in einer einzigen Antwort zurückgegeben werden.

Was kann Gemini 2.5 Flash?

Gemini 2.5 Flash unterstützt Vision, Tool Calling, Reasoning, Dokumente, Prompt-Caching.

Ist Gemini 2.5 Flash kostenlos nutzbar?

Gemini 2.5 Flash ist ein kostenpflichtiges Pay-as-you-go-Modell — kein Abonnement, du wirst nur für die tatsächliche Nutzung berechnet.

Wie verwende ich Gemini 2.5 Flash über die API?

Gemini 2.5 Flash ist OpenAI-kompatibel. Richte ein beliebiges OpenAI SDK auf https://api.airforce/v1 aus und übergib die Modell-ID gemini-2.5-flash zusammen mit deinem Api.Airforce API-Key.

Von wem stammt Gemini 2.5 Flash?

Gemini 2.5 Flash ist das Chat-Modell von Google, bereitgestellt über das einheitliche Api.Airforce-Gateway neben 100+ weiteren Modellen.

GoogleBezahltBetriebsbereit

Gemini 2.5 Flash

API-Modellname: gemini-2.5-flash

Gemini 2.5 Flash ist das Chat-Modell von Google, bereitgestellt über die einheitliche API von Api.Airforce. Es verfügt über ein Kontextfenster von 1M Tokens. Neben Text akzeptiert es image, audio, video, document als Eingabe. Zu den Funktionen gehören Vision, Tool Calling, Reasoning, Dokumente, Prompt-Caching. Es kostet 0,35 € pro Million Eingabe-Tokens und 2,19 € pro Million Ausgabe-Tokens. Das liegt unter dem offiziellen Eingabepreis des Anbieters von 0,66 €. Wissensstand: 2025-01. Greife über die OpenAI-kompatible API mit einem einzigen Schlüssel darauf zu — zusammen mit über 65 weiteren Modellen auf Api.Airforce.

API-Schlüssel anfordern Preise ansehen

Preise

Eingabe / 1M Tokens

≈ 0,35 €

Ausgabe / 1M Tokens

≈ 2,19 €

Offizieller Eingabepreis

≈ 0,66 €

Offizieller Ausgabepreis

≈ 3,93 €

Api.Airforce-Preis im Vergleich zum offiziellen Preis des Anbieters.

Spezifikationen

Anbieter: Google
Typ: Chat-Modell
Kontextfenster: 1M Tokens
Maximale Ausgabe: 66K Tokens
Wissensstand: 2025-01
Eingabe: text, image, audio, video, document
Ausgabe: text
Prompt-Caching: Unterstützt

Funktionen

VisionTool CallingReasoningDokumentePrompt-CachingStreaming

Benchmarks

Unabhängige Bewertungen und gemessene Geschwindigkeit von Artificial Analysis.

Intelligenz-Index

20.6/100

Coding-Index

17.8/100

Mathe-Index

60.3/100

MMLU-Pro81%

GPQA Diamond68%

Humanity's Last Exam5%

LiveCodeBench50%

AIME 202560%

MATH-50093%

Ausgabegeschwindigkeit201.0 tok/s

Zeit bis zum ersten Token0.52 s

Quelle: Benchmark data by Artificial Analysis (artificialanalysis.ai)

Wofür wird Gemini 2.5 Flash verwendet?

Chatbots & Assistenten — konversationelle KI, Textentwürfe, Zusammenfassungen und Q&A.
Bildverständnis — Fotos, Screenshots, Diagramme und gescannte Dokumente analysieren.
Agenten & Automatisierung — Function Calling und Tool Use für mehrstufige Workflows.
Komplexes Schlussfolgern — Mathematik, Coding und schrittweises Problemlösen.
Dokumentenanalyse — lange Dateien zusammenfassen und Fragen dazu beantworten.
Long-Context-Aufgaben — ganze Dokumente oder Codebasen in einem einzigen Prompt verarbeiten.
Echtzeit-Erlebnisse — Token streamen für reaktionsschnelle Chats und Apps.

Gemini 2.5 Flash vs. ähnliche Modelle

Modell	Intelligenz	Kontext	Input / 1M	Output / 1M
Gemini 2.5 Flash	20.6	1M	0,35 €	2,19 €
Gemini 2.5 Pro	34.6	2M	0,61 €	1,92 €
Gemini 3 Flash	35.0	1M	0,35 €	2,10 €
Gemini 3 Pro	48.4	2M	0,79 €	2,40 €

Preise sind Api.Airforce Pay-as-you-go-Tarife pro 1M Token. Der Kontext ist die maximale Eingabelänge.

Gemini 2.5 Flash — häufig gestellte Fragen

Was kostet Gemini 2.5 Flash?: Gemini 2.5 Flash wird Pay-as-you-go abgerechnet: 0,35 € pro 1M Input-Token und 2,19 € pro 1M Output-Token. Kein Abonnement — du zahlst nur, was du verwendest.
Wie groß ist das Kontextfenster von Gemini 2.5 Flash?: Gemini 2.5 Flash unterstützt ein Kontextfenster von bis zu 1M Token. Es können bis zu 66K Token in einer einzigen Antwort zurückgegeben werden.
Was kann Gemini 2.5 Flash?: Gemini 2.5 Flash unterstützt Vision, Tool Calling, Reasoning, Dokumente, Prompt-Caching.
Ist Gemini 2.5 Flash kostenlos nutzbar?: Gemini 2.5 Flash ist ein kostenpflichtiges Pay-as-you-go-Modell — kein Abonnement, du wirst nur für die tatsächliche Nutzung berechnet.
Wie verwende ich Gemini 2.5 Flash über die API?: Gemini 2.5 Flash ist OpenAI-kompatibel. Richte ein beliebiges OpenAI SDK auf https://api.airforce/v1 aus und übergib die Modell-ID gemini-2.5-flash zusammen mit deinem Api.Airforce API-Key.
Von wem stammt Gemini 2.5 Flash?: Gemini 2.5 Flash ist das Chat-Modell von Google, bereitgestellt über das einheitliche Api.Airforce-Gateway neben 100+ weiteren Modellen.

Alle Modelle·Schnellstart·Chat-API-Referenz

Gemini 2.5 Flash über die API nutzen

OpenAI-kompatibel — richte ein beliebiges OpenAI-SDK auf https://api.airforce/v1 und übergib gemini-2.5-flash als Modell.

cURL

curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-2.5-flash",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'

Python

from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="gemini-2.5-flash",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)

JavaScript

import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "gemini-2.5-flash",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);