j9九游会官方S1模子并不是从零初始测验-欧洲杯下单平台(官方)APP下载IOS/安卓通用版/手机版
发布日期:2025-02-27 06:46 点击次数:94
(原标题:364元就能诞生DeepSeek模子?假的!)j9九游会官方
近日,一则“炸裂”的AI新闻激发人人蜿蜒。
斯坦福大学和华盛顿大学的谋划东谈主员发表的一篇谋划论文显露,他们以不到50好意思元(约364元)的云预计用度,测验出一款名为S1的推理模子。该模子在数学和编码才调测试中,与OpenAI的o1和DeepSeek的R1推崇不相高下。
这是AI领域的又一次首要冲破吗?事实并非如斯。
证实谋划论文,S1模子并不是从零初始测验,而所以阿里通义千问Qwen2.5-32B开源模子为底座,然后在16块H100 GPU上进行了26分钟的监督微调,最终测验出新模子S1-32B。
在推理才调方面,谋划东谈主员则通过蒸馏技巧,从谷歌的AI推理模子Gemini 2.0中索求了推理才调。
某大模子厂商的研发东谈主员告诉21世纪经济报谈记者,S1模子实质上是在前东谈主谋划的基础上复制了推理才调,而非信得过立异。
但S1模子的出现,也为头部大模子厂商敲响警钟。如若头部大模子厂商进入强大资源测验出来的模子,其他东谈主用小数的资源就能复制并已毕一样的才调j9九游会官方,那头部厂商的“护城河”究竟是什么?