NVIDIAGratuitOpérationnel

Nemotron Nano 9b V2

Nom du modèle API: nemotron-nano-9b-v2

Nemotron Nano 9b V2 est le modèle de chat de NVIDIA, servi sur l'API unifiée d'Api.Airforce. Il dispose d'une fenêtre de contexte de 131K tokens. Ses capacités incluent Appel d'outils, Raisonnement. Il est disponible sur l'offre gratuite, sans coût par token. Date de coupure des connaissances : 2025-03-31. Accédez-y via l'API compatible OpenAI avec une seule clé, aux côtés de plus de 65 autres modèles sur Api.Airforce.

Tarifs

Entrée / 1M tokens
Gratuit
Sortie / 1M tokens
Gratuit

Spécifications

Fournisseur
NVIDIA
Type
modèle de chat
Fenêtre de contexte
131K tokens
Sortie maximale
16K tokens
Date de coupure des connaissances
2025-03-31
Entrée
text
Sortie
text

Capacités

Appel d'outilsRaisonnementStreaming

Utiliser Nemotron Nano 9b V2 via l'API

Compatible OpenAI — pointez n'importe quel SDK OpenAI vers https://api.airforce/v1 et passez nemotron-nano-9b-v2 comme modèle.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nemotron-nano-9b-v2",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="nemotron-nano-9b-v2",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "nemotron-nano-9b-v2",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Performances en temps réel

Débit et latence réels sur l'ensemble des fournisseurs servant ce modèle.

Chargement des métriques en temps réel…

Modèles associés