Gemini 3.1 Flash Lite 的费用是多少？

Gemini 3.1 Flash Lite 按量计费：输入 ¥0.95 / 1M token，输出 ¥5.08 / 1M token。无需订阅，仅按实际用量收费。

Gemini 3.1 Flash Lite 的上下文窗口有多大？

Gemini 3.1 Flash Lite 支持最大 1M token 的上下文窗口。单次响应最多可返回 33K token。

Gemini 3.1 Flash Lite 具备哪些能力？

Gemini 3.1 Flash Lite 支持视觉, 工具调用, 推理, 文档, 提示词缓存。

Gemini 3.1 Flash Lite 是否免费使用？

Gemini 3.1 Flash Lite 是付费按量计费模型——无需订阅，仅按用量收费。

如何通过 API 使用 Gemini 3.1 Flash Lite？

Gemini 3.1 Flash Lite 兼容 OpenAI 接口。将任意 OpenAI SDK 的请求地址指向 https://api.airforce/v1，传入模型 ID gemini-3.1-flash-lite 及您的 Api.Airforce API 密钥即可。

Gemini 3.1 Flash Lite 由谁开发？

Gemini 3.1 Flash Lite 是 Google 的聊天模型，通过 Api.Airforce 统一网关提供服务，接入 100+ 款其他模型。

Google付费运行正常

Gemini 3.1 Flash Lite

API 模型名称: gemini-3.1-flash-lite

Gemini 3.1 Flash Lite 是 Google 的聊天模型，通过 Api.Airforce 统一 API 提供服务。它拥有 1M tokens 的上下文窗口。除文本外，它还接受 image, audio, video, document 作为输入。功能包括视觉, 工具调用, 推理, 文档, 提示词缓存。它的定价为每百万输入 tokens ¥0.95，每百万输出 tokens ¥5.08。这低于供应商 ¥1.69 的官方输入费率。知识截止日期：2026-03。通过 OpenAI 兼容 API 使用一个密钥即可访问它，以及 Api.Airforce 上的 100+ 其他模型。

获取 API 密钥查看价格

价格

输入 / 1M tokens

≈ ¥0.95

输出 / 1M tokens

≈ ¥5.08

缓存读取 / 1M tokens

≈ ¥0.14

官方输入费率

≈ ¥1.69

官方输出费率

≈ ¥10.15

Api.Airforce 价格与供应商官方费率对比。

规格参数

供应商: Google
类型: 聊天模型
上下文窗口: 1M tokens
最大输出: 33K tokens
知识截止日期: 2026-03
输入: text, image, audio, video, document
输出: text
提示词缓存: 支持

功能特性

视觉工具调用推理文档提示词缓存流式传输

基准测试

来自 Artificial Analysis 的独立评测与实测速度。

智能指数

25.0/100

编程指数

34.7/100

GPQA Diamond82%

Humanity's Last Exam16%

输出速度311.0 tok/s

首个 token 时间5.03 秒

来源: Benchmark data by Artificial Analysis (artificialanalysis.ai)

Gemini 3.1 Flash Lite 适用于哪些场景？

聊天机器人与助手——对话式 AI、起草、摘要与 Q&A。
图像理解——分析照片、截图、图表和扫描文档。
智能体与自动化——函数调用与工具使用，支持多步骤工作流。
复杂推理——数学、编程与逐步问题求解。
文档分析——跨长篇文件进行摘要与问答。
长上下文任务——在单次提示中处理完整文档或代码库。
实时体验——流式输出 token，打造响应迅速的聊天与应用。

Gemini 3.1 Flash Lite 与同类模型对比

模型	智能	上下文	输入 / 1M	输出 / 1M
Gemini 3.1 Flash Lite	25.0	1M	¥0.95	¥5.08
Gemini 2.5 Flash	14.1	1M	¥2.71	¥16.92
Gemini 2.5 Pro	25.8	2M	¥4.74	¥14.89
Gemini 3 Flash	27.4	1M	¥1.76	¥10.76

价格为 Api.Airforce 按量计费费率，单位为每 1M token。上下文为最大输入长度。

Gemini 3.1 Flash Lite — 常见问题

Gemini 3.1 Flash Lite 的费用是多少？: Gemini 3.1 Flash Lite 按量计费：输入 ¥0.95 / 1M token，输出 ¥5.08 / 1M token。无需订阅，仅按实际用量收费。
Gemini 3.1 Flash Lite 的上下文窗口有多大？: Gemini 3.1 Flash Lite 支持最大 1M token 的上下文窗口。单次响应最多可返回 33K token。
Gemini 3.1 Flash Lite 具备哪些能力？: Gemini 3.1 Flash Lite 支持视觉, 工具调用, 推理, 文档, 提示词缓存。
Gemini 3.1 Flash Lite 是否免费使用？: Gemini 3.1 Flash Lite 是付费按量计费模型——无需订阅，仅按用量收费。
如何通过 API 使用 Gemini 3.1 Flash Lite？: Gemini 3.1 Flash Lite 兼容 OpenAI 接口。将任意 OpenAI SDK 的请求地址指向 https://api.airforce/v1，传入模型 ID gemini-3.1-flash-lite 及您的 Api.Airforce API 密钥即可。
Gemini 3.1 Flash Lite 由谁开发？: Gemini 3.1 Flash Lite 是 Google 的聊天模型，通过 Api.Airforce 统一网关提供服务，接入 100+ 款其他模型。

所有模型·快速开始·Chat API 参考

通过 API 使用 Gemini 3.1 Flash Lite

OpenAI 兼容 —— 将任意 OpenAI SDK 指向 https://api.airforce/v1 并传入 gemini-3.1-flash-lite 作为模型。

cURL

curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.1-flash-lite",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'

Python

from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="gemini-3.1-flash-lite",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)

JavaScript

import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "gemini-3.1-flash-lite",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);