Modelos
Liste todos os modelos disponíveis em sua chave de API, completos com sinalizadores de capacidade, limites de contexto e preços por token.
Tudo de que o resto da API depende pode ser descoberto a partir de uma chamada: quais modelos aceitam imagens, tools, reasoning ou caching, sua janela de contexto e seu preço por token. Consulte o endpoint de models e filtre pelas flags de capacidade abaixo em vez de fixar listas de modelos no seu app.
Note que o campo created é a hora atual do servidor na listagem, não uma data de lançamento por modelo, e o campo status reflete a saúde em tempo real — refaça a busca em vez de mantê-lo em cache por muito tempo.
GET /v1/models
Retorna a lista de modelos que você pode usar agora. As solicitações autenticadas incluem todos os modelos por usuário que você ativou no painel. A forma reflete a do OpenAI GET /v1/models com campos extras de capacidade do Airforce.
https://api.airforce/v1/modelsExemplo
curl https://api.airforce/v1/models \
-H "Authorization: Bearer sk-air-YOUR_API_KEY"Forma de resposta
O envelope de nível superior é { object: "list", data: Model[] }. Cada Model possui os campos abaixo - os campos marcados como opcionais podem ser omitidos quando desconhecidos.
| Parameter | Type | Required | Description |
|---|---|---|---|
| id | string | Optional | Public model identifier you pass as the "model" field on every other endpoint, e.g. "claude-sonnet-4.6" or "gpt-5.1-chat". |
| object | string | Optional | Always "model". |
| created | integer | Optional | Unix timestamp at which this listing was generated (current server time) — not a stable per-model creation date. |
| owned_by | string | Optional | Vendor name: "openai", "anthropic", "google", "deepseek", … |
| catalog_id | string | Optional | Canonical vendor identifier for the underlying model family (e.g. "anthropic/claude-sonnet-4-6"). Stable across Airforce ID changes. |
| context_length | integer | Optional | Total context window in tokens (input + output). |
| max_output_tokens | integer | Optional | Hard cap on a single response. Use this as the upper bound when picking max_tokens. |
| input_modalities | array | Optional | Subset of ["text", "image", "audio", "document", "video"] the model accepts as input. |
| output_modalities | array | Optional | Subset of ["text", "image", "audio", "video"] the model can produce. |
| supports_chat | boolean | Optional | Available on /v1/chat/completions and /v1/messages. |
| supports_streaming | boolean | Optional | Honors stream: true. |
| supports_vision | boolean | Optional | Accepts image_url content blocks. |
| supports_tools | boolean | Optional | Accepts the tools / tool_choice parameters. |
| supports_reasoning | boolean | Optional | Honors reasoning_effort / thinking / thinking_budget. |
| supports_documents | boolean | Optional | Accepts document content blocks (PDF, etc.). |
| supports_caching | boolean | Optional | Honors cache_control on Anthropic-style system prompts. |
| supports_audio_input | boolean | Optional | Accepts audio content blocks (multimodal STT-in-chat). |
| supports_video_input | boolean | Optional | Accepts video content blocks. |
| knowledge_cutoff | string | Optional | Vendor-published knowledge cutoff month, e.g. "2025-09". |
| status | string | Optional | Live health: "operational" | "degraded" | "partial_outage" | "major_outage" (legacy "stable" / "down" / "offline" may also appear). |
| pricepermilliontokens | integer | Optional | Input cost in cents per 1M tokens. Output side has output_pricepermilliontokens. |
| cache_read_pricepermilliontokens | integer | Optional | Discounted rate for cache-hit input tokens (Anthropic-style caching). |
Resposta de exemplo
{
"object": "list",
"data": [
{
"id": "claude-sonnet-4.6",
"object": "model",
"created": 1740000000,
"owned_by": "anthropic",
"catalog_id": "anthropic/claude-sonnet-4-6",
"context_length": 200000,
"max_output_tokens": 64000,
"input_modalities": ["text", "image", "document"],
"output_modalities": ["text"],
"supports_chat": true,
"supports_streaming": true,
"supports_vision": true,
"supports_tools": true,
"supports_reasoning": true,
"supports_documents": true,
"supports_caching": true,
"knowledge_cutoff": "2025-08",
"status": "operational",
"pricepermilliontokens": 300,
"output_pricepermilliontokens": 1500,
"cache_read_pricepermilliontokens": 30
}
// … more models
]
}Filtrando por capacidade
A filtragem por capacidades é feita no cliente com as flags abaixo. Os filtros mais comuns:
const res = await fetch('https://api.airforce/v1/models', {
headers: { Authorization: `Bearer ${API_KEY}` },
});
const { data } = await res.json();
// Vision-capable chat models
const visionModels = data.filter(m => m.supports_chat && m.supports_vision);
// Cheapest reasoning model with at least 100k context
const reasoning = data
.filter(m => m.supports_reasoning && (m.context_length ?? 0) >= 100_000)
.sort((a, b) => (a.pricepermilliontokens ?? 0) - (b.pricepermilliontokens ?? 0))[0];
// All models from one vendor, by canonical catalog family
const allClaude = data.filter(m => m.catalog_id?.startsWith('anthropic/'));Existe um parâmetro de query opcional do lado do servidor: GET /v1/models?channels=1 devolve adicionalmente entradas de alias por canal (para clientes com noção de routing); sem ele, esses aliases são omitidos.
Campos de preços
Todos *pricepermilliontokens os campos são centavos inteiros por 1.000.000 de tokens. Divida por 100 para obter USD por milhão.
| Parameter | Type | Required | Description |
|---|---|---|---|
| pricepermilliontokens | integer | Optional | Input tokens, cents per 1M. |
| output_pricepermilliontokens | integer | Optional | Output tokens, cents per 1M. |
| cache_write_5m_pricepermilliontokens | integer | Optional | Cache-write rate for 5-minute TTL caches (Anthropic). |
| cache_write_1h_pricepermilliontokens | integer | Optional | Cache-write rate for 1-hour TTL caches (Anthropic). |
| cache_read_pricepermilliontokens | integer | Optional | Cache-read rate (typically 10× cheaper than uncached input). |
Status e descontinuação do modelo
| Parameter | Type | Required | Description |
|---|---|---|---|
| operational | status | Optional | Healthy — recent calls are succeeding. The usual value for an available model. |
| degraded | status | Optional | Callable, but with elevated errors or latency. |
| partial_outage | status | Optional | A subset of upstream channels is failing. |
| major_outage | status | Optional | Most or all calls are currently failing. |
| stable / down / offline | status | Optional | Legacy or admin-set values that may also appear. |
Os modelos com hard-disable não são um valor de status — são excluídos por completo de /v1/models (para qualquer caller, incluindo admins) e são invocados apenas pelo nome exato através de ferramentas de admin.
Quer uma visualização navegável?
O /página de modelos renderiza esses mesmos dados com agrupamento, pesquisa e comparações de preços.