NVIDIA免费运行正常

Nemotron Nano 12b V2 Vl

API 模型名称: nemotron-nano-12b-v2-vl

Nemotron Nano 12b V2 Vl 是 NVIDIA 的聊天模型,通过 Api.Airforce 统一 API 提供服务。 它拥有 128K tokens 的上下文窗口。 除文本外,它还接受 image, video 作为输入。 功能包括 视觉, 工具调用, 推理。 它在免费层级提供,不收取任何按 token 计费的费用。 通过 OpenAI 兼容 API 使用一个密钥即可访问它,以及 Api.Airforce 上的 65+ 其他模型。

价格

输入 / 1M tokens
免费
输出 / 1M tokens
免费

规格参数

供应商
NVIDIA
类型
聊天模型
上下文窗口
128K tokens
最大输出
128K tokens
输入
image, text, video
输出
text

功能特性

视觉工具调用推理流式传输

通过 API 使用 Nemotron Nano 12b V2 Vl

OpenAI 兼容 —— 将任意 OpenAI SDK 指向 https://api.airforce/v1 并传入 nemotron-nano-12b-v2-vl 作为模型。

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nemotron-nano-12b-v2-vl",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="nemotron-nano-12b-v2-vl",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "nemotron-nano-12b-v2-vl",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

实时性能

服务该模型的各供应商的真实吞吐量与延迟。

正在加载实时指标……

相关模型