ai987.cn

智哥的个人AI技能学习日志

谷歌发布“Gemini-0605”，又全球第一！

2025-06-06

Written by

谷歌发布“Gemini-0605”，又全球第一！ - Image 1

昨晚，Gemini发布0605版本。

上个月发布的 0506 的I/O版本，带来了编码性能的提升。但是我们复盘中提到过，似乎在通用基准上，存在第二轮瓶颈（“过于关注coding能力后，还不如0325版本”）。半年复盘，AI迎来预训练后的新瓶颈。

Google不愧是挤牙膏大神，新版本又挤出来了，官方表示新版将回归0325版本的效果。。。

谷歌发布“Gemini-0605”，又全球第一！ - Image 2

今天的 0605 版本则在 AIDER Polyglot 等基准测试中继续领先，同时在 GPQA 和人类终极考试（HLE）等极具挑战性的基准测试中表现出“顶级性能”，这些测试评估了模型的数学、科学、知识和推理能力。

谷歌发布“Gemini-0605”，又全球第一！ - Image 3

刷 LMArena ，一直是谷歌的强项，0605 版本在 LMArena 上的 Elo 评分提升了 24 分，目前得分为 1470 分，而在 WebDevArena 上则实现了 35 分的 Elo 评分，达到 1443 分。

官方提到，在上一次模型更新后，人们注意到除了编码之外的性能有所下降。谷歌现在正针对这一反馈进行改进，提升了“风格和结构”，从而使 Gemini 2.5 Pro 能够“更具创意并提供格式更优的回答”。

谷歌发布“Gemini-0605”，又全球第一！ - Image 4

现在打开Google AI Studio可以免费体验。

谷歌发布“Gemini-0605”，又全球第一！ - Image 5

值得注意的是，这次正式取消了日期后缀，意味着，这可能是2.5的最后一个版本！

Google AI Studio也且用且珍惜把，天天这种神人跑去问这些问题，迟早也要对免费用户下刀~

谷歌发布“Gemini-0605”，又全球第一！ - Image 6

输入Token价格是o3的1/8，Claude 4 Opus的不到1/10、Grok 3的不到一半，输出Token则是o3的1/4、Claude的13%、Grok的2/3。

初步测试了一些，体验还不错。贴个归藏大佬的例子，之前大佬评测的这个颜色提取器prompt，同时考验模型的审美和功能，基本所有的顶级模型都不能完成所有要求，新版本Gemini一次性可以完成的非常好。

谷歌发布“Gemini-0605”，又全球第一！ - Image 7

谷歌发布“Gemini-0605”，又全球第一！ - Image 8

未来知识库是“欧米伽未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。

⌜ 免责声明 ⌝
本站仅为个人学习AI（人工智能）知识的相关日志，网页内容（如有图片或视频亦包括在内）短期缓存均无商业目的。
遇有侵害您合法权益之处欲申诉删改，可联络处理（删/改）！