ai987.cn

智哥的个人AI技能学习日志

阿里云回应李飞飞团队50美元训练出AI模型

2025-02-07

Written by

大神分享

行业动态

2月6日消息，美国斯坦福大学和华盛顿大学研究人员李飞飞团队宣布，以低于50美元的云计算成本训练出人工智能推理模型s1-32B。

该模型在数学及编码测试中表现与OpenAI的o1、DeepSeek的R1等尖端模型相当，引发行业关注。

据媒体报道，s1-32B实为基于阿里云通义千问Qwen2.5-32B-Instruct开源模型的微调产物。

报道称，阿里云证实，该团队以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座，在16块H100GPU上监督微调26分钟，训练出新模型s1-32B，取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果，甚至在竞赛数学问题上的表现比o1-preview高出27%。

本文源自观点网

出处：头条号 @金融界

⌜ 免责声明 ⌝
本站仅为个人学习AI（人工智能）知识的相关日志，网页内容（如有图片或视频亦包括在内）短期缓存均无商业目的。
遇有侵害您合法权益之处欲申诉删改，可联络处理（删/改）！

阿里云回应李飞飞团队50美元训练出AI模型

More posts

智谱GLM 5.2逼近美国顶尖模型 开源优势重塑AI竞争格局

DeepSeek V4 开源模型超越 GPT-5.3 登顶 MMLU 榜首

技术现代化基金推新提案呼吁 投资两亿美元加速联邦数字化转型

AI创业避开花哨竞争 聚焦枯燥痛点打造独角兽

智谱GLM 5.2逼近美国顶尖模型开源优势重塑AI竞争格局

技术现代化基金推新提案呼吁投资两亿美元加速联邦数字化转型

AI创业避开花哨竞争聚焦枯燥痛点打造独角兽