Claude Fable 5 领衔,六月 AI 模型发布潮

据 ai987.cn 于 2026 年 6 月 12 日收到的消息 ‣ AI Release Tracker 最新数据显示,截至 2026 年 6 月,多家头部人工智能实验室密集发布前沿大模型。Anthropic 于 6 月 9 日推出 Claude Fable 5,成为目前追踪名单中最新的模型,其在 SWE-Pro 基准上得分 80.3%。

Claude Fable 5 领衔,六月 AI 模型发布潮 - Image 1

Anthropic 方面,除 Fable 5 外,5 月 28 日发布的 Claude Opus 4.8 在 HLE 得分 57.9%、SWE-Pro 得分 69.2%;4 月 16 日发布的 Claude Opus 4.7 HLE 得分 54.7%;2 月 17 日发布的 Claude Sonnet 4.6 在 SWE-Ver 达到 79.6%。

Google DeepMind 5 月 19 日同步推出 Gemini Omni 与 Gemini 3.5 Flash,后者 HLE 得分 40.2%、SWE-Pro 得分 55.1%。早前还发布了 Gemini 3.1 系列,包括 3.1 Pro(HLE 51.4%)及 3.1 Flash 与 3.1 Flash-Lite。

OpenAI 4 月 23 日发布 GPT-5.5 与 GPT-5.5-Pro,前者 HLE 52.2%、SWE-Pro 58.6%,后者 FrontierMath 得分 52.4%。3 月 5 日推出 GPT-5.4 与 GPT-5.4-Pro,2 月 12 日发布 GPT-5.3-Codex-Spark,3 月 3 日发布 GPT-5.3-Instant。

DeepSeek 4 月 24 日发布 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash,GPQA 得分分别达 90.1% 与 88.1%。Meta 4 月 8 日推出 Muse Spark,GPQA 89.5%、SWE-Ver 77.4%。xAI 分别于 4 月 17 日与 2 月 17 日发布 Grok 4.3 Beta 与 Grok 4.20 Beta。Mistral 4 月 29 日发布 Medium 3.5(SWE-Ver 77.6%),3 月 16 日发布 Small 4。Moonshot AI 4 月 21 日发布 Kimi K2.6。Cursor 则推出了 Composer 2.5(SWE-Multi 79.8%)与 Composer 2。

上述榜单涵盖 OpenAI、Anthropic、Google DeepMind、Meta、xAI、DeepSeek、Mistral、Moonshot AI 及 Cursor 等九家实验室的 25 款最新模型,按发布时间倒序排列。

综合自 AI Release Tracker 报道。


吉ICP备2020006555号

ai987.cn

⌜ 免 责 声 明 ⌝
本站仅为个人学习AI(人工智能)知识的相关日志,网页内容(如有图片或视频亦包括在内)短期缓存均无商业目的。
遇有侵害您合法权益之处欲申诉删改,可联络处理(删/改)!