Quanto custa Gemini 2.5 Flash?

Gemini 2.5 Flash é cobrado no modelo pay-as-you-go a 0,35 € por 1M de tokens de entrada e 2,17 € por 1M de tokens de saída. Não há assinatura — você paga apenas pelo que usar.

Qual é a janela de contexto do Gemini 2.5 Flash?

Gemini 2.5 Flash suporta uma janela de contexto de até 1M tokens. Pode retornar até 66K tokens em uma única resposta.

O que Gemini 2.5 Flash consegue fazer?

Gemini 2.5 Flash suporta Visão, Chamada de ferramentas, Raciocínio, Documentos, Cache de prompts.

Gemini 2.5 Flash é gratuito?

Gemini 2.5 Flash é um modelo pago no modelo pay-as-you-go — sem assinatura, você é cobrado apenas pelo uso.

Como uso Gemini 2.5 Flash via API?

Gemini 2.5 Flash é compatível com OpenAI. Aponte qualquer SDK OpenAI para https://api.airforce/v1 e passe o ID do modelo gemini-2.5-flash com sua chave de API da Api.Airforce.

Quem criou Gemini 2.5 Flash?

Gemini 2.5 Flash é o modelo de chat da Google, disponibilizado pelo gateway unificado da Api.Airforce junto com 100+ outros modelos.

GooglePagoOperacional

Gemini 2.5 Flash

Nome do modelo na API: gemini-2.5-flash

Gemini 2.5 Flash é o modelo de chat da Google, disponibilizado na API unificada da Api.Airforce. Ele tem uma janela de contexto de 1M tokens. Além de texto, ele aceita image, audio, video, document como entrada. Os recursos incluem Visão, Chamada de ferramentas, Raciocínio, Documentos, Cache de prompts. Tem o preço de 0,35 € por milhão de tokens de entrada e 2,17 € por milhão de tokens de saída. Isso fica abaixo da taxa oficial de entrada de 0,65 € do provedor. Corte de conhecimento: 2025-01. Acesse-o pela API compatível com OpenAI com uma única chave, junto com mais de 65 outros modelos na Api.Airforce.

Obter uma chave de API Ver preços

Preços

Entrada / 1M tokens

≈ 0,35 €

Saída / 1M tokens

≈ 2,17 €

Taxa oficial de entrada

≈ 0,65 €

Taxa oficial de saída

≈ 3,91 €

Preço da Api.Airforce em comparação com a taxa oficial do provedor.

Especificações

Provedor: Google
Tipo: modelo de chat
Janela de contexto: 1M tokens
Saída máxima: 66K tokens
Corte de conhecimento: 2025-01
Entrada: text, image, audio, video, document
Saída: text
Cache de prompts: Suportado

Recursos

VisãoChamada de ferramentasRaciocínioDocumentosCache de promptsStreaming

Benchmarks

Avaliações independentes e velocidade medida da Artificial Analysis.

Índice de inteligência

14.1/100

Índice de matemática

60.3/100

MMLU-Pro81%

GPQA Diamond68%

Humanity's Last Exam5%

LiveCodeBench50%

AIME 202560%

MATH-50093%

Velocidade de saída228.2 tok/s

Tempo até o primeiro token0.52 s

Fonte: Benchmark data by Artificial Analysis (artificialanalysis.ai)

Para que serve Gemini 2.5 Flash?

Chatbots e assistentes — IA conversacional, rascunhos, resumos e Q&A.
Compreensão de imagens — analise fotos, capturas de tela, gráficos e documentos digitalizados.
Agentes e automação — chamada de funções e uso de ferramentas em fluxos multietapas.
Raciocínio complexo — matemática, programação e resolução de problemas passo a passo.
Análise de documentos — resuma e responda perguntas sobre arquivos extensos.
Tarefas de contexto longo — processe documentos inteiros ou bases de código em um único prompt.
Experiências em tempo real — transmita tokens para chats e aplicativos responsivos.

Gemini 2.5 Flash vs. modelos similares

Modelo	Inteligência	Contexto	Entrada / 1M	Saída / 1M
Gemini 2.5 Flash	14.1	1M	0,35 €	2,17 €
Gemini 2.5 Pro	25.8	2M	0,61 €	1,91 €
Gemini 3 Flash	27.4	1M	0,23 €	1,38 €
Gemini 3 Pro	39.6	2M	1,65 €	8,67 €

Preços são as tarifas pay-as-you-go da Api.Airforce por 1M de tokens. O contexto é o comprimento máximo de entrada.

Modelos relacionados

Gemini 2.5 ProGoogle · 0,61 € / 1M Gemini 3 FlashGoogle · 0,23 € / 1M Gemini 3 ProGoogle · 1,65 € / 1M Gemini 3.1 Flash LiteGoogle · 0,12 € / 1M Gemini 3.1 ProGoogle · 0,87 € / 1M Gemini 3.1 Pro Preview CustomtoolsGoogle · 1,54 € / 1M Gemini 3.5 FlashGoogle · 1,04 € / 1M Gemini 3.5 Flash LiteGoogle · 0,22 € / 1M Gemini 3.6 FlashGoogle · 1,07 € / 1M Gemma 4 26b A4b ItGoogle · Grátis Gemma3 270mGoogle · Grátis Nano Banana 2Google · 112,91 € / 1M

Gemini 2.5 Flash — perguntas frequentes

Quanto custa Gemini 2.5 Flash?: Gemini 2.5 Flash é cobrado no modelo pay-as-you-go a 0,35 € por 1M de tokens de entrada e 2,17 € por 1M de tokens de saída. Não há assinatura — você paga apenas pelo que usar.
Qual é a janela de contexto do Gemini 2.5 Flash?: Gemini 2.5 Flash suporta uma janela de contexto de até 1M tokens. Pode retornar até 66K tokens em uma única resposta.
O que Gemini 2.5 Flash consegue fazer?: Gemini 2.5 Flash suporta Visão, Chamada de ferramentas, Raciocínio, Documentos, Cache de prompts.
Gemini 2.5 Flash é gratuito?: Gemini 2.5 Flash é um modelo pago no modelo pay-as-you-go — sem assinatura, você é cobrado apenas pelo uso.
Como uso Gemini 2.5 Flash via API?: Gemini 2.5 Flash é compatível com OpenAI. Aponte qualquer SDK OpenAI para https://api.airforce/v1 e passe o ID do modelo gemini-2.5-flash com sua chave de API da Api.Airforce.
Quem criou Gemini 2.5 Flash?: Gemini 2.5 Flash é o modelo de chat da Google, disponibilizado pelo gateway unificado da Api.Airforce junto com 100+ outros modelos.

Todos os modelos·Início rápido·Referência da Chat API

Use Gemini 2.5 Flash pela API

Compatível com OpenAI — aponte qualquer SDK da OpenAI para https://api.airforce/v1 e passe gemini-2.5-flash como o modelo.

cURL

curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-2.5-flash",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'

Python

from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="gemini-2.5-flash",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)

JavaScript

import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "gemini-2.5-flash",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);