API REFERENCE

Modelos

Liste todos os modelos disponíveis em sua chave de API, completos com sinalizadores de capacidade, limites de contexto e preços por token.

Tudo de que o resto da API depende pode ser descoberto a partir de uma chamada: quais modelos aceitam imagens, tools, reasoning ou caching, sua janela de contexto e seu preço por token. Consulte o endpoint de models e filtre pelas flags de capacidade abaixo em vez de fixar listas de modelos no seu app.

Note que o campo created é a hora atual do servidor na listagem, não uma data de lançamento por modelo, e o campo status reflete a saúde em tempo real — refaça a busca em vez de mantê-lo em cache por muito tempo.

GET /v1/models

Retorna a lista de modelos que você pode usar agora. As solicitações autenticadas incluem todos os modelos por usuário que você ativou no painel. A forma reflete a do OpenAI GET /v1/models com campos extras de capacidade do Airforce.

GEThttps://api.airforce/v1/models

Exemplo

curl https://api.airforce/v1/models \
  -H "Authorization: Bearer sk-air-YOUR_API_KEY"

Forma de resposta

O envelope de nível superior é { object: "list", data: Model[] }. Cada Model possui os campos abaixo - os campos marcados como opcionais podem ser omitidos quando desconhecidos.

Parameter	Type	Required	Description
id	string	Optional	Public model identifier you pass as the "model" field on every other endpoint, e.g. "claude-sonnet-4.6" or "gpt-5.1-chat".
object	string	Optional	Always "model".
created	integer	Optional	Unix timestamp at which this listing was generated (current server time) — not a stable per-model creation date.
owned_by	string	Optional	Vendor name: "openai", "anthropic", "google", "deepseek", …
catalog_id	string	Optional	Canonical vendor identifier for the underlying model family (e.g. "anthropic/claude-sonnet-4-6"). Stable across Airforce ID changes.
context_length	integer	Optional	Total context window in tokens (input + output).
max_output_tokens	integer	Optional	Hard cap on a single response. Use this as the upper bound when picking max_tokens.
input_modalities	array	Optional	Subset of ["text", "image", "audio", "document", "video"] the model accepts as input.
output_modalities	array	Optional	Subset of ["text", "image", "audio", "video"] the model can produce.
supports_chat	boolean	Optional	Available on /v1/chat/completions and /v1/messages.
supports_streaming	boolean	Optional	Honors stream: true.
supports_vision	boolean	Optional	Accepts image_url content blocks.
supports_tools	boolean	Optional	Accepts the tools / tool_choice parameters.
supports_reasoning	boolean	Optional	Honors the canonical reasoning_effort / thinking / thinking_budget parameters. Cross-model (Claude, OpenAI o/GPT-5, Gemini, Qwen, DeepSeek hybrid, …) — not a vendor-specific API. Prefer this flag over guessing from the model name.
supports_documents	boolean	Optional	Accepts document content blocks (PDF, etc.).
supports_caching	boolean	Optional	Honors cache_control on Anthropic-style system prompts.
supports_audio_input	boolean	Optional	Accepts audio content blocks (multimodal STT-in-chat).
supports_video_input	boolean	Optional	Accepts video content blocks.
knowledge_cutoff	string	Optional	Vendor-published knowledge cutoff month, e.g. "2025-09".
status	string	Optional	Live health: "operational" \| "degraded" \| "partial_outage" \| "major_outage" (legacy "stable" / "down" / "offline" may also appear).
pricepermilliontokens	integer	Optional	Input cost in cents per 1M tokens. Output side has output_pricepermilliontokens.
cache_read_pricepermilliontokens	integer	Optional	Discounted rate for cache-hit input tokens (Anthropic-style caching).

Resposta de exemplo

{
  "object": "list",
  "data": [
    {
      "id": "claude-sonnet-4.6",
      "object": "model",
      "created": 1740000000,
      "owned_by": "anthropic",
      "catalog_id": "anthropic/claude-sonnet-4-6",
      "context_length": 200000,
      "max_output_tokens": 64000,
      "input_modalities": ["text", "image", "document"],
      "output_modalities": ["text"],
      "supports_chat": true,
      "supports_streaming": true,
      "supports_vision": true,
      "supports_tools": true,
      "supports_reasoning": true,
      "supports_documents": true,
      "supports_caching": true,
      "knowledge_cutoff": "2025-08",
      "status": "operational",
      "pricepermilliontokens": 300,
      "output_pricepermilliontokens": 1500,
      "cache_read_pricepermilliontokens": 30
    }
    // … more models
  ]
}

Filtrando por capacidade

A filtragem por capacidades é feita no cliente com as flags abaixo. Os filtros mais comuns:

const res = await fetch('https://api.airforce/v1/models', {
  headers: { Authorization: `Bearer ${API_KEY}` },
});
const { data } = await res.json();

// Vision-capable chat models
const visionModels = data.filter(m => m.supports_chat && m.supports_vision);

// Cheapest reasoning model with at least 100k context
const reasoning = data
  .filter(m => m.supports_reasoning && (m.context_length ?? 0) >= 100_000)
  .sort((a, b) => (a.pricepermilliontokens ?? 0) - (b.pricepermilliontokens ?? 0))[0];

// All models from one vendor, by canonical catalog family
const allClaude = data.filter(m => m.catalog_id?.startsWith('anthropic/'));

Existe um parâmetro de query opcional do lado do servidor: GET /v1/models?channels=1 devolve adicionalmente entradas de alias por canal (para clientes com noção de routing); sem ele, esses aliases são omitidos.

Free-tier model IDs (:free suffix)

Some models are also published as a free-tier variant. Request it by appending :free to the model ID — e.g. "deepseek-v3.2:free" — anywhere you pass a model. The suffix only works when that exact free variant exists in /v1/models; otherwise the request is treated as an unknown model. Free variants are subject to the daily free-tier token cap, but are not counted against the global per-second request throttle.

Campos de preços

Todos *pricepermilliontokens os campos são centavos inteiros por 1.000.000 de tokens. Divida por 100 para obter USD por milhão.

Parameter	Type	Required	Description
pricepermilliontokens	integer	Optional	Input tokens, cents per 1M.
output_pricepermilliontokens	integer	Optional	Output tokens, cents per 1M.
cache_write_5m_pricepermilliontokens	integer	Optional	Cache-write rate for 5-minute TTL caches (Anthropic).
cache_write_1h_pricepermilliontokens	integer	Optional	Cache-write rate for 1-hour TTL caches (Anthropic).
cache_read_pricepermilliontokens	integer	Optional	Cache-read rate (typically 10× cheaper than uncached input).

Status e descontinuação do modelo

Parameter	Type	Required	Description
operational	status	Optional	Healthy — recent calls are succeeding. The usual value for an available model.
degraded	status	Optional	Callable, but with elevated errors or latency.
partial_outage	status	Optional	A subset of upstream channels is failing.
major_outage	status	Optional	Most or all calls are currently failing.
stable / down / offline	status	Optional	Legacy or admin-set values that may also appear.

Os modelos com hard-disable não são um valor de status — são excluídos por completo de /v1/models (para qualquer caller, incluindo admins) e são invocados apenas pelo nome exato através de ferramentas de admin.

Quer uma visualização navegável?

O /página de modelos renderiza esses mesmos dados com agrupamento, pesquisa e comparações de preços.