Google DeepMind 于 3 月 3 日发布 Gemini 3.1 Flash Lite,这是 Gemini 3 系列中速度最快、成本最低的模型,目前通过 Google AI Studio 和 Vertex AI 以开发者预览版形式提供。
核心能力:
- 支持 1M token 超长上下文窗口
- 多模态输入:文本、图像、音频、视频全覆盖
- 速度比 Gemini 2.5 Flash 快约 2.5 倍
- 价格定位极具竞争力,针对高频开发者工作负载优化
定位: Flash Lite 不是旗舰,而是”高频调用场景的最优解”——适合 API 批量处理、实时响应、成本敏感型应用。这个定位让它成为开发者构建 AI 产品的重要基础设施选项。
随着 Gemini 3.1 Flash Lite 上线,Google 的模型家族覆盖从旗舰(3.1 Pro)到轻量(Flash Lite)的完整梯队,与 OpenAI 的产品线策略愈发相似。