Gemini 3 Flash 的费用是多少？

Gemini 3 Flash 按量计费：输入 ¥1.76 / 1M token，输出 ¥10.76 / 1M token。无需订阅，仅按实际用量收费。

Gemini 3 Flash 的上下文窗口有多大？

Gemini 3 Flash 支持最大 1M token 的上下文窗口。单次响应最多可返回 33K token。

Gemini 3 Flash 具备哪些能力？

Gemini 3 Flash 支持视觉, 工具调用, 推理, 文档, 提示词缓存。

Gemini 3 Flash 是否免费使用？

Gemini 3 Flash 是付费按量计费模型——无需订阅，仅按用量收费。

如何通过 API 使用 Gemini 3 Flash？

Gemini 3 Flash 兼容 OpenAI 接口。将任意 OpenAI SDK 的请求地址指向 https://api.airforce/v1，传入模型 ID gemini-3-flash 及您的 Api.Airforce API 密钥即可。

Gemini 3 Flash 由谁开发？

Gemini 3 Flash 是 Google 的聊天模型，通过 Api.Airforce 统一网关提供服务，接入 100+ 款其他模型。

Google付费运行正常

Gemini 3 Flash

API 模型名称: gemini-3-flash

Gemini 3 Flash 是 Google 的聊天模型，通过 Api.Airforce 统一 API 提供服务。它拥有 1M tokens 的上下文窗口。除文本外，它还接受 image, audio, video, document 作为输入。功能包括视觉, 工具调用, 推理, 文档, 提示词缓存。它的定价为每百万输入 tokens ¥1.76，每百万输出 tokens ¥10.76。这低于供应商 ¥3.38 的官方输入费率。知识截止日期：2026-01。通过 OpenAI 兼容 API 使用一个密钥即可访问它，以及 Api.Airforce 上的 100+ 其他模型。

获取 API 密钥查看价格

价格

输入 / 1M tokens

≈ ¥1.76

输出 / 1M tokens

≈ ¥10.76

缓存读取 / 1M tokens

≈ ¥0.14

官方输入费率

≈ ¥3.38

官方输出费率

≈ ¥20.31

Api.Airforce 价格与供应商官方费率对比。

规格参数

供应商: Google
类型: 聊天模型
上下文窗口: 1M tokens
最大输出: 33K tokens
知识截止日期: 2026-01
输入: text, image, audio, video, document
输出: text
提示词缓存: 支持

功能特性

视觉工具调用推理文档提示词缓存流式传输

基准测试

来自 Artificial Analysis 的独立评测与实测速度。

智能指数

27.4/100

数学指数

55.7/100

MMLU-Pro88%

GPQA Diamond81%

Humanity's Last Exam14%

LiveCodeBench80%

AIME 202556%

输出速度221.8 tok/s

首个 token 时间0.74 秒

来源: Benchmark data by Artificial Analysis (artificialanalysis.ai)

Gemini 3 Flash 适用于哪些场景？

聊天机器人与助手——对话式 AI、起草、摘要与 Q&A。
图像理解——分析照片、截图、图表和扫描文档。
智能体与自动化——函数调用与工具使用，支持多步骤工作流。
复杂推理——数学、编程与逐步问题求解。
文档分析——跨长篇文件进行摘要与问答。
长上下文任务——在单次提示中处理完整文档或代码库。
实时体验——流式输出 token，打造响应迅速的聊天与应用。

Gemini 3 Flash 与同类模型对比

模型	智能	上下文	输入 / 1M	输出 / 1M
Gemini 3 Flash	27.4	1M	¥1.76	¥10.76
Gemini 2.5 Flash	14.1	1M	¥2.71	¥16.92
Gemini 2.5 Pro	25.8	2M	¥4.74	¥14.89
Gemini 3 Pro	39.6	2M	¥12.86	¥67.55

价格为 Api.Airforce 按量计费费率，单位为每 1M token。上下文为最大输入长度。

Gemini 3 Flash — 常见问题

Gemini 3 Flash 的费用是多少？: Gemini 3 Flash 按量计费：输入 ¥1.76 / 1M token，输出 ¥10.76 / 1M token。无需订阅，仅按实际用量收费。
Gemini 3 Flash 的上下文窗口有多大？: Gemini 3 Flash 支持最大 1M token 的上下文窗口。单次响应最多可返回 33K token。
Gemini 3 Flash 具备哪些能力？: Gemini 3 Flash 支持视觉, 工具调用, 推理, 文档, 提示词缓存。
Gemini 3 Flash 是否免费使用？: Gemini 3 Flash 是付费按量计费模型——无需订阅，仅按用量收费。
如何通过 API 使用 Gemini 3 Flash？: Gemini 3 Flash 兼容 OpenAI 接口。将任意 OpenAI SDK 的请求地址指向 https://api.airforce/v1，传入模型 ID gemini-3-flash 及您的 Api.Airforce API 密钥即可。
Gemini 3 Flash 由谁开发？: Gemini 3 Flash 是 Google 的聊天模型，通过 Api.Airforce 统一网关提供服务，接入 100+ 款其他模型。

所有模型·快速开始·Chat API 参考

通过 API 使用 Gemini 3 Flash

OpenAI 兼容 —— 将任意 OpenAI SDK 指向 https://api.airforce/v1 并传入 gemini-3-flash 作为模型。

cURL

curl https://api.airforce/v1/chat/completions \
  -H "Authorization: Bearer $AIRFORCE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3-flash",
    "messages": [{ "role": "user", "content": "Hello!" }]
  }'

Python

from openai import OpenAI
client = OpenAI(base_url="https://api.airforce/v1", api_key="$AIRFORCE_API_KEY")
r = client.chat.completions.create(
    model="gemini-3-flash",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(r.choices[0].message.content)

JavaScript

import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.airforce/v1", apiKey: process.env.AIRFORCE_API_KEY });
const r = await client.chat.completions.create({
  model: "gemini-3-flash",
  messages: [{ role: "user", content: "Hello!" }],
});
console.log(r.choices[0].message.content);