GoogleTrả phíĐang hoạt động

Gemini 3.5 Flash

Tên mô hình API: gemini-3.5-flash

Gemini 3.5 Flash là mô hình trò chuyện của Google, được phục vụ trên API hợp nhất của Api.Airforce. Nó có cửa sổ ngữ cảnh 128K token. Ngoài văn bản, nó còn chấp nhận image, video, file, audio làm đầu vào. Các khả năng bao gồm Thị giác, Gọi công cụ, Suy luận, Tài liệu, Lưu bộ nhớ đệm prompt. Nó có giá 31.409 ₫ cho mỗi triệu token đầu vào và 188.452 ₫ cho mỗi triệu token đầu ra. Mức giá đó thấp hơn giá đầu vào chính thức 39.261 ₫ của nhà cung cấp. Truy cập nó thông qua API tương thích với OpenAI chỉ với một khóa, cùng với hơn 65 mô hình khác trên Api.Airforce.

Bảng giá

Đầu vào / 1M token
≈ 31.409 ₫
Đầu ra / 1M token
≈ 188.452 ₫
Giá đầu vào chính thức
≈ 39.261 ₫

Giá Api.Airforce so với giá chính thức của nhà cung cấp.

Thông số kỹ thuật

Nhà cung cấp
Google
Loại
mô hình trò chuyện
Cửa sổ ngữ cảnh
128K token
Đầu ra tối đa
66K token
Đầu vào
text, image, video, file, audio
Đầu ra
text

Khả năng

Thị giácGọi công cụSuy luậnTài liệuLưu bộ nhớ đệm promptTruyền phát

Sử dụng Gemini 3.5 Flash qua API

Tương thích với OpenAI — trỏ bất kỳ OpenAI SDK nào tới https://api.airforce/v1 và truyền gemini-3.5-flash làm mô hình.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.5-flash",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="gemini-3.5-flash",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "gemini-3.5-flash",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Hiệu suất trực tiếp

Thông lượng và độ trễ thực tế trên các nhà cung cấp phục vụ mô hình này.

Đang tải số liệu trực tiếp…

Mô hình liên quan