阿里云回应李飞飞团队50美元训练出AI模型

2月6日消息,美国斯坦福大学和华盛顿大学研究人员李飞飞团队宣布,以低于50美元的云计算成本训练出人工智能推理模型s1-32B。

该模型在数学及编码测试中表现与OpenAI的o1、DeepSeek的R1等尖端模型相当,引发行业关注。

据媒体报道,s1-32B实为基于阿里云通义千问Qwen2.5-32B-Instruct开源模型的微调产物。

报道称,阿里云证实,该团队以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,在16块H100GPU上监督微调26分钟,训练出新模型s1-32B,取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比o1-preview高出27%。

本文源自观点网

出处:头条号 @金融界

吉ICP备2020006555号

ai987.cn

⌜ 免 责 声 明 ⌝
本站仅为个人学习AI(人工智能)知识的相关日志,网页内容(如有图片或视频亦包括在内)短期缓存均无商业目的。
遇有侵害您合法权益之处欲申诉删改,可联络处理(删/改)!