GoogleTrả phíĐang hoạt động

Gemini 3.1 Flash Lite

Tên mô hình API: gemini-3.1-flash-lite

Gemini 3.1 Flash Lite là mô hình trò chuyện của Google, được phục vụ trên API hợp nhất của Api.Airforce. Nó có cửa sổ ngữ cảnh 1M token. Ngoài văn bản, nó còn chấp nhận image, audio, video, document làm đầu vào. Các khả năng bao gồm Thị giác, Gọi công cụ, Tài liệu, Lưu bộ nhớ đệm prompt. Nó có giá 3.664 ₫ cho mỗi triệu token đầu vào và 19.630 ₫ cho mỗi triệu token đầu ra. Mức giá đó thấp hơn giá đầu vào chính thức 6.543 ₫ của nhà cung cấp. Thời điểm cập nhật kiến thức: 2026-03. Truy cập nó thông qua API tương thích với OpenAI chỉ với một khóa, cùng với hơn 65 mô hình khác trên Api.Airforce.

Bảng giá

Đầu vào / 1M token
≈ 3.664 ₫
Đầu ra / 1M token
≈ 19.630 ₫
Giá đầu vào chính thức
≈ 6.543 ₫

Giá Api.Airforce so với giá chính thức của nhà cung cấp.

Thông số kỹ thuật

Nhà cung cấp
Google
Loại
mô hình trò chuyện
Cửa sổ ngữ cảnh
1M token
Đầu ra tối đa
33K token
Thời điểm cập nhật kiến thức
2026-03
Đầu vào
text, image, audio, video, document
Đầu ra
text

Khả năng

Thị giácGọi công cụTài liệuLưu bộ nhớ đệm promptTruyền phát

Sử dụng Gemini 3.1 Flash Lite qua API

Tương thích với OpenAI — trỏ bất kỳ OpenAI SDK nào tới https://api.airforce/v1 và truyền gemini-3.1-flash-lite làm mô hình.

cURL
curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.1-flash-lite",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'
Python
from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="gemini-3.1-flash-lite",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)
JavaScript
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "gemini-3.1-flash-lite",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);

Hiệu suất trực tiếp

Thông lượng và độ trễ thực tế trên các nhà cung cấp phục vụ mô hình này.

Đang tải số liệu trực tiếp…

Mô hình liên quan