Google付费运行正常

Gemini 3.1 Flash Lite

API 模型名称: gemini-3.1-flash-lite

Gemini 3.1 Flash Lite 是 Google 的聊天模型,通过 Api.Airforce 统一 API 提供服务。 它拥有 1M tokens 的上下文窗口。 除文本外,它还接受 image, audio, video, document 作为输入。 功能包括 视觉, 工具调用, 文档, 提示词缓存。 它的定价为每百万输入 tokens ¥0.95,每百万输出 tokens ¥5.09。 这低于供应商 ¥1.70 的官方输入费率。 知识截止日期:2026-03。 通过 OpenAI 兼容 API 使用一个密钥即可访问它,以及 Api.Airforce 上的 100+ 其他模型。

价格

输入 / 1M tokens
≈ ¥0.95
输出 / 1M tokens
≈ ¥5.09
缓存读取 / 1M tokens
≈ ¥0.14
官方输入费率
≈ ¥1.70
官方输出费率
≈ ¥10.18

Api.Airforce 价格与供应商官方费率对比。

规格参数

供应商
Google
类型
聊天模型
上下文窗口
1M tokens
最大输出
33K tokens
知识截止日期
2026-03
输入
text, image, audio, video, document
输出
text
提示词缓存
支持

功能特性

视觉工具调用文档提示词缓存流式传输

基准测试

来自 Artificial Analysis 的独立评测与实测速度。

智能指数
33.5/100
编程指数
30.1/100
GPQA Diamond82%
Humanity's Last Exam16%
输出速度325.2 tok/s
首个 token 时间5.23 秒

来源: Benchmark data by Artificial Analysis (artificialanalysis.ai)

Gemini 3.1 Flash Lite 适用于哪些场景?

  • 聊天机器人与助手——对话式 AI、起草、摘要与 Q&A。
  • 图像理解——分析照片、截图、图表和扫描文档。
  • 智能体与自动化——函数调用与工具使用,支持多步骤工作流。
  • 文档分析——跨长篇文件进行摘要与问答。
  • 长上下文任务——在单次提示中处理完整文档或代码库。
  • 实时体验——流式输出 token,打造响应迅速的聊天与应用。

Gemini 3.1 Flash Lite 与同类模型对比

模型智能上下文输入 / 1M输出 / 1M
Gemini 3.1 Flash Lite33.51M¥0.95¥5.09
Gemini 2.5 Flash20.61M¥2.71¥16.97
Gemini 2.5 Pro34.62M¥4.75¥14.93
Gemini 3 Flash35.01M¥2.71¥16.29

价格为 Api.Airforce 按量计费费率,单位为每 1M token。上下文为最大输入长度。

相关模型

Gemini 3.1 Flash Lite — 常见问题

Gemini 3.1 Flash Lite 的费用是多少?
Gemini 3.1 Flash Lite 按量计费:输入 ¥0.95 / 1M token,输出 ¥5.09 / 1M token。无需订阅,仅按实际用量收费。
Gemini 3.1 Flash Lite 的上下文窗口有多大?
Gemini 3.1 Flash Lite 支持最大 1M token 的上下文窗口。 单次响应最多可返回 33K token。
Gemini 3.1 Flash Lite 具备哪些能力?
Gemini 3.1 Flash Lite 支持 视觉, 工具调用, 文档, 提示词缓存。
Gemini 3.1 Flash Lite 是否免费使用?
Gemini 3.1 Flash Lite 是付费按量计费模型——无需订阅,仅按用量收费。
如何通过 API 使用 Gemini 3.1 Flash Lite?
Gemini 3.1 Flash Lite 兼容 OpenAI 接口。将任意 OpenAI SDK 的请求地址指向 https://api.airforce/v1,传入模型 ID gemini-3.1-flash-lite 及您的 Api.Airforce API 密钥即可。
Gemini 3.1 Flash Lite 由谁开发?
Gemini 3.1 Flash Lite 是 Google 的聊天模型,通过 Api.Airforce 统一网关提供服务,接入 100+ 款其他模型。