Google发布Gemini2.5Flash预览版首个完全混合推理模型

无限长的字节 2025-04-18 17:58:33

在上周的Cloud Next 大会上,Google宣布Gemini 2.5 Flash 模型即将推出,并带来重大改进。今天,Google宣布通过 Google AI Studio 和 Vertex AI 在 Gemini API 中推出 Gemini 2.5 Flash 预览版。Gemini 用户也可以通过模型选择器使用此新模型,并可与 Canvas 配合使用,轻松优化文档和代码。

继上一代 Gemini 2.0 Flash 之后,Gemini 2.5 Flash 在推理能力方面进行了显著提升,且成本和延迟均有所降低。Google声称这款新机型拥有卓越的性价比。具体价格如下:

每 100 万输入词元 0.15 美元

每 100 万个输出词元 收费 0.60 美元(无需推理)

每 100 万个输出词元(含推理)收费 3.50 美元

这是 Flash 2.5 的早期版本,但相比 Flash 2.0 版本,它已展现出巨大的性能提升。

如有需要,您可以完全关闭思考功能,并使用此模型作为 Flash 2.0 的直接替代品。

它可在 Gemini API、AI Studio、Vertex 和 Gemini 应用中使用!

— Logan Kilpatrick (@OfficialLoganK)

Gemini 2.5 Flash 是 Google 首款完全混合推理模型,允许开发者选择开启或关闭推理功能。据称,这可以帮助开发者根据目标质量、成本和延迟来优化响应。请查看下方此新模型的基准测试。

如上表所示,尽管成本低廉,但与 Anthropic 和 Grok 的前沿模型相比,Gemini 2.5 Flash 似乎仍不失优势。OpenAI 近期发布的o4-mini似乎性能优于 Gemini 2.5 Flash 预览版,但价格却高得多。

0 阅读:0

无限长的字节

简介:感谢大家的关注