GooglePagoOperacional

Gemini 2.5 Flash

Nome do modelo na API: gemini-2.5-flash

Gemini 2.5 Flash é o modelo de chat da Google, disponibilizado na API unificada da Api.Airforce. Ele tem uma janela de contexto de 1M tokens. Além de texto, ele aceita image, audio, video, document como entrada. Os recursos incluem Visão, Chamada de ferramentas, Raciocínio, Documentos, Cache de prompts. Tem o preço de 0,35 € por milhão de tokens de entrada e 2,19 € por milhão de tokens de saída. Isso fica abaixo da taxa oficial de entrada de 0,66 € do provedor. Corte de conhecimento: 2025-01. Acesse-o pela API compatível com OpenAI com uma única chave, junto com mais de 65 outros modelos na Api.Airforce.

Preços

Entrada / 1M tokens
≈ 0,35 €
Saída / 1M tokens
≈ 2,19 €
Taxa oficial de entrada
≈ 0,66 €
Taxa oficial de saída
≈ 3,93 €

Preço da Api.Airforce em comparação com a taxa oficial do provedor.

Especificações

Provedor
Google
Tipo
modelo de chat
Janela de contexto
1M tokens
Saída máxima
66K tokens
Corte de conhecimento
2025-01
Entrada
text, image, audio, video, document
Saída
text
Cache de prompts
Suportado

Recursos

VisãoChamada de ferramentasRaciocínioDocumentosCache de promptsStreaming

Benchmarks

Avaliações independentes e velocidade medida da Artificial Analysis.

Índice de inteligência
20.6/100
Índice de programação
17.8/100
Índice de matemática
60.3/100
MMLU-Pro81%
GPQA Diamond68%
Humanity's Last Exam5%
LiveCodeBench50%
AIME 202560%
MATH-50093%
Velocidade de saída201.0 tok/s
Tempo até o primeiro token0.52 s

Fonte: Benchmark data by Artificial Analysis (artificialanalysis.ai)

Para que serve Gemini 2.5 Flash?

  • Chatbots e assistentes — IA conversacional, rascunhos, resumos e Q&A.
  • Compreensão de imagens — analise fotos, capturas de tela, gráficos e documentos digitalizados.
  • Agentes e automação — chamada de funções e uso de ferramentas em fluxos multietapas.
  • Raciocínio complexo — matemática, programação e resolução de problemas passo a passo.
  • Análise de documentos — resuma e responda perguntas sobre arquivos extensos.
  • Tarefas de contexto longo — processe documentos inteiros ou bases de código em um único prompt.
  • Experiências em tempo real — transmita tokens para chats e aplicativos responsivos.

Gemini 2.5 Flash vs. modelos similares

ModeloInteligênciaContextoEntrada / 1MSaída / 1M
Gemini 2.5 Flash20.61M0,35 €2,19 €
Gemini 2.5 Pro34.62M0,61 €1,92 €
Gemini 3 Flash35.01M0,35 €2,10 €
Gemini 3 Pro48.42M0,79 €2,40 €

Preços são as tarifas pay-as-you-go da Api.Airforce por 1M de tokens. O contexto é o comprimento máximo de entrada.

Modelos relacionados

Gemini 2.5 Flash — perguntas frequentes

Quanto custa Gemini 2.5 Flash?
Gemini 2.5 Flash é cobrado no modelo pay-as-you-go a 0,35 € por 1M de tokens de entrada e 2,19 € por 1M de tokens de saída. Não há assinatura — você paga apenas pelo que usar.
Qual é a janela de contexto do Gemini 2.5 Flash?
Gemini 2.5 Flash suporta uma janela de contexto de até 1M tokens. Pode retornar até 66K tokens em uma única resposta.
O que Gemini 2.5 Flash consegue fazer?
Gemini 2.5 Flash suporta Visão, Chamada de ferramentas, Raciocínio, Documentos, Cache de prompts.
Gemini 2.5 Flash é gratuito?
Gemini 2.5 Flash é um modelo pago no modelo pay-as-you-go — sem assinatura, você é cobrado apenas pelo uso.
Como uso Gemini 2.5 Flash via API?
Gemini 2.5 Flash é compatível com OpenAI. Aponte qualquer SDK OpenAI para https://api.airforce/v1 e passe o ID do modelo gemini-2.5-flash com sua chave de API da Api.Airforce.
Quem criou Gemini 2.5 Flash?
Gemini 2.5 Flash é o modelo de chat da Google, disponibilizado pelo gateway unificado da Api.Airforce junto com 100+ outros modelos.