Google付费运行正常

Gemini 3 Flash

API 模型名称: gemini-3-flash

Gemini 3 Flash 是 Google 的聊天模型,通过 Api.Airforce 统一 API 提供服务。 它拥有 1M tokens 的上下文窗口。 除文本外,它还接受 image, audio, video, document 作为输入。 功能包括 视觉, 工具调用, 推理, 文档, 提示词缓存。 它的定价为每百万输入 tokens ¥2.71,每百万输出 tokens ¥16.29。 这低于供应商 ¥3.39 的官方输入费率。 知识截止日期:2026-01。 通过 OpenAI 兼容 API 使用一个密钥即可访问它,以及 Api.Airforce 上的 100+ 其他模型。

价格

输入 / 1M tokens
≈ ¥2.71
输出 / 1M tokens
≈ ¥16.29
官方输入费率
≈ ¥3.39
官方输出费率
≈ ¥20.36

Api.Airforce 价格与供应商官方费率对比。

规格参数

供应商
Google
类型
聊天模型
上下文窗口
1M tokens
最大输出
33K tokens
知识截止日期
2026-01
输入
text, image, audio, video, document
输出
text
提示词缓存
支持

功能特性

视觉工具调用推理文档提示词缓存流式传输

基准测试

来自 Artificial Analysis 的独立评测与实测速度。

智能指数
35.0/100
编程指数
37.8/100
数学指数
55.7/100
MMLU-Pro88%
GPQA Diamond81%
Humanity's Last Exam14%
LiveCodeBench80%
AIME 202556%
输出速度205.6 tok/s
首个 token 时间5.01 秒

来源: Benchmark data by Artificial Analysis (artificialanalysis.ai)

Gemini 3 Flash 适用于哪些场景?

  • 聊天机器人与助手——对话式 AI、起草、摘要与 Q&A。
  • 图像理解——分析照片、截图、图表和扫描文档。
  • 智能体与自动化——函数调用与工具使用,支持多步骤工作流。
  • 复杂推理——数学、编程与逐步问题求解。
  • 文档分析——跨长篇文件进行摘要与问答。
  • 长上下文任务——在单次提示中处理完整文档或代码库。
  • 实时体验——流式输出 token,打造响应迅速的聊天与应用。

Gemini 3 Flash 与同类模型对比

模型智能上下文输入 / 1M输出 / 1M
Gemini 3 Flash35.01M¥2.71¥16.29
Gemini 2.5 Flash20.61M¥2.71¥16.97
Gemini 2.5 Pro34.62M¥4.75¥14.93
Gemini 3 Pro48.42M¥6.11¥18.66

价格为 Api.Airforce 按量计费费率,单位为每 1M token。上下文为最大输入长度。

相关模型

Gemini 3 Flash — 常见问题

Gemini 3 Flash 的费用是多少?
Gemini 3 Flash 按量计费:输入 ¥2.71 / 1M token,输出 ¥16.29 / 1M token。无需订阅,仅按实际用量收费。
Gemini 3 Flash 的上下文窗口有多大?
Gemini 3 Flash 支持最大 1M token 的上下文窗口。 单次响应最多可返回 33K token。
Gemini 3 Flash 具备哪些能力?
Gemini 3 Flash 支持 视觉, 工具调用, 推理, 文档, 提示词缓存。
Gemini 3 Flash 是否免费使用?
Gemini 3 Flash 是付费按量计费模型——无需订阅,仅按用量收费。
如何通过 API 使用 Gemini 3 Flash?
Gemini 3 Flash 兼容 OpenAI 接口。将任意 OpenAI SDK 的请求地址指向 https://api.airforce/v1,传入模型 ID gemini-3-flash 及您的 Api.Airforce API 密钥即可。
Gemini 3 Flash 由谁开发?
Gemini 3 Flash 是 Google 的聊天模型,通过 Api.Airforce 统一网关提供服务,接入 100+ 款其他模型。