据 ai987.cn 于 2026 年 6 月 12 日收到的消息 ‣ AI Release Tracker 最新数据显示,截至 2026 年 6 月,多家头部人工智能实验室密集发布前沿大模型。Anthropic 于 6 月 9 日推出 Claude Fable 5,成为目前追踪名单中最新的模型,其在 SWE-Pro 基准上得分 80.3%。

Anthropic 方面,除 Fable 5 外,5 月 28 日发布的 Claude Opus 4.8 在 HLE 得分 57.9%、SWE-Pro 得分 69.2%;4 月 16 日发布的 Claude Opus 4.7 HLE 得分 54.7%;2 月 17 日发布的 Claude Sonnet 4.6 在 SWE-Ver 达到 79.6%。
Google DeepMind 5 月 19 日同步推出 Gemini Omni 与 Gemini 3.5 Flash,后者 HLE 得分 40.2%、SWE-Pro 得分 55.1%。早前还发布了 Gemini 3.1 系列,包括 3.1 Pro(HLE 51.4%)及 3.1 Flash 与 3.1 Flash-Lite。
OpenAI 4 月 23 日发布 GPT-5.5 与 GPT-5.5-Pro,前者 HLE 52.2%、SWE-Pro 58.6%,后者 FrontierMath 得分 52.4%。3 月 5 日推出 GPT-5.4 与 GPT-5.4-Pro,2 月 12 日发布 GPT-5.3-Codex-Spark,3 月 3 日发布 GPT-5.3-Instant。
DeepSeek 4 月 24 日发布 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash,GPQA 得分分别达 90.1% 与 88.1%。Meta 4 月 8 日推出 Muse Spark,GPQA 89.5%、SWE-Ver 77.4%。xAI 分别于 4 月 17 日与 2 月 17 日发布 Grok 4.3 Beta 与 Grok 4.20 Beta。Mistral 4 月 29 日发布 Medium 3.5(SWE-Ver 77.6%),3 月 16 日发布 Small 4。Moonshot AI 4 月 21 日发布 Kimi K2.6。Cursor 则推出了 Composer 2.5(SWE-Multi 79.8%)与 Composer 2。
上述榜单涵盖 OpenAI、Anthropic、Google DeepMind、Meta、xAI、DeepSeek、Mistral、Moonshot AI 及 Cursor 等九家实验室的 25 款最新模型,按发布时间倒序排列。
综合自 AI Release Tracker 报道。