GooglePagoOperacional

Gemini 3.1 Flash Lite

Nome do modelo na API: gemini-3.1-flash-lite

Gemini 3.1 Flash Lite é o modelo de chat da Google, disponibilizado na API unificada da Api.Airforce. Ele tem uma janela de contexto de 1M tokens. Além de texto, ele aceita image, audio, video, document como entrada. Os recursos incluem Visão, Chamada de ferramentas, Documentos, Cache de prompts. Tem o preço de 0,12 € por milhão de tokens de entrada e 0,66 € por milhão de tokens de saída. Isso fica abaixo da taxa oficial de entrada de 0,22 € do provedor. Corte de conhecimento: 2026-03. Acesse-o pela API compatível com OpenAI com uma única chave, junto com mais de 65 outros modelos na Api.Airforce.

Preços

Entrada / 1M tokens
≈ 0,12 €
Saída / 1M tokens
≈ 0,66 €
Leitura de cache / 1M tokens
≈ 0,02 €
Taxa oficial de entrada
≈ 0,22 €
Taxa oficial de saída
≈ 1,31 €

Preço da Api.Airforce em comparação com a taxa oficial do provedor.

Especificações

Provedor
Google
Tipo
modelo de chat
Janela de contexto
1M tokens
Saída máxima
33K tokens
Corte de conhecimento
2026-03
Entrada
text, image, audio, video, document
Saída
text
Cache de prompts
Suportado

Recursos

VisãoChamada de ferramentasDocumentosCache de promptsStreaming

Benchmarks

Avaliações independentes e velocidade medida da Artificial Analysis.

Índice de inteligência
33.5/100
Índice de programação
30.1/100
GPQA Diamond82%
Humanity's Last Exam16%
Velocidade de saída325.2 tok/s
Tempo até o primeiro token5.23 s

Fonte: Benchmark data by Artificial Analysis (artificialanalysis.ai)

Para que serve Gemini 3.1 Flash Lite?

  • Chatbots e assistentes — IA conversacional, rascunhos, resumos e Q&A.
  • Compreensão de imagens — analise fotos, capturas de tela, gráficos e documentos digitalizados.
  • Agentes e automação — chamada de funções e uso de ferramentas em fluxos multietapas.
  • Análise de documentos — resuma e responda perguntas sobre arquivos extensos.
  • Tarefas de contexto longo — processe documentos inteiros ou bases de código em um único prompt.
  • Experiências em tempo real — transmita tokens para chats e aplicativos responsivos.

Gemini 3.1 Flash Lite vs. modelos similares

ModeloInteligênciaContextoEntrada / 1MSaída / 1M
Gemini 3.1 Flash Lite33.51M0,12 €0,66 €
Gemini 2.5 Flash20.61M0,35 €2,19 €
Gemini 2.5 Pro34.62M0,61 €1,92 €
Gemini 3 Flash35.01M0,35 €2,10 €

Preços são as tarifas pay-as-you-go da Api.Airforce por 1M de tokens. O contexto é o comprimento máximo de entrada.

Modelos relacionados

Gemini 3.1 Flash Lite — perguntas frequentes

Quanto custa Gemini 3.1 Flash Lite?
Gemini 3.1 Flash Lite é cobrado no modelo pay-as-you-go a 0,12 € por 1M de tokens de entrada e 0,66 € por 1M de tokens de saída. Não há assinatura — você paga apenas pelo que usar.
Qual é a janela de contexto do Gemini 3.1 Flash Lite?
Gemini 3.1 Flash Lite suporta uma janela de contexto de até 1M tokens. Pode retornar até 33K tokens em uma única resposta.
O que Gemini 3.1 Flash Lite consegue fazer?
Gemini 3.1 Flash Lite suporta Visão, Chamada de ferramentas, Documentos, Cache de prompts.
Gemini 3.1 Flash Lite é gratuito?
Gemini 3.1 Flash Lite é um modelo pago no modelo pay-as-you-go — sem assinatura, você é cobrado apenas pelo uso.
Como uso Gemini 3.1 Flash Lite via API?
Gemini 3.1 Flash Lite é compatível com OpenAI. Aponte qualquer SDK OpenAI para https://api.airforce/v1 e passe o ID do modelo gemini-3.1-flash-lite com sua chave de API da Api.Airforce.
Quem criou Gemini 3.1 Flash Lite?
Gemini 3.1 Flash Lite é o modelo de chat da Google, disponibilizado pelo gateway unificado da Api.Airforce junto com 100+ outros modelos.