GooglePagoOperacional

Gemini 3.5 Flash

Nome do modelo na API: gemini-3.5-flash

Gemini 3.5 Flash é o modelo de chat da Google, disponibilizado na API unificada da Api.Airforce. Ele tem uma janela de contexto de 128K tokens. Além de texto, ele aceita image, video, file, audio como entrada. Os recursos incluem Visão, Chamada de ferramentas, Raciocínio, Documentos, Cache de prompts. Tem o preço de 1,03 € por milhão de tokens de entrada e 6,19 € por milhão de tokens de saída. Isso fica abaixo da taxa oficial de entrada de 1,29 € do provedor. Acesse-o pela API compatível com OpenAI com uma única chave, junto com mais de 65 outros modelos na Api.Airforce.

Preços

Entrada / 1M tokens
≈ 1,03 €
Saída / 1M tokens
≈ 6,19 €
Taxa oficial de entrada
≈ 1,29 €

Preço da Api.Airforce em comparação com a taxa oficial do provedor.

Especificações

Provedor
Google
Tipo
modelo de chat
Janela de contexto
128K tokens
Saída máxima
66K tokens
Entrada
text, image, video, file, audio
Saída
text

Recursos

VisãoChamada de ferramentasRaciocínioDocumentosCache de promptsStreaming

Use Gemini 3.5 Flash pela API

Compatível com OpenAI — aponte qualquer SDK da OpenAI para https://api.airforce/v1 e passe gemini-3.5-flash como o modelo.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.5-flash",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "gemini-3.5-flash",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Desempenho ao vivo

Throughput e latência reais entre os fornecedores que servem este modelo.

Carregando métricas ao vivo…

Modelos relacionados