• 验证码登录/注册
  • 密码登录

登录失败,用户名或者密码错误


备注:已注册帐号可切换到密码登录,初始密码为123456。
收不到验证码请联系微信客服:shifenyuedukf
登录

首页  > 快讯

李飞飞团队s1模型基于Qwen训练?阿里云确认:基于Qwen2.5-32B-Instruct模型训练

5月前
【李飞飞团队s1模型基于Qwen训练?阿里云确认:基于Qwen2.5-32B-Instruct模型训练】今日,李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型,该模型在数学和编码能力测试中的表现与OpenAl的o1和Depsek的R1等尖端推理模型类似,引发广泛关注。不过很快,该s1模型被指“并非从零开始训练”,其基座模型为“阿里通义千问(Qwen)模型”。对此,新浪科技向阿里云方面求证,阿里云方面确认了这一消息,并回应称:“他们以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,在16块H100 GPU上监督微调26分钟,训练出新模型s1-32B, 取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比o1-preview高出27%。”(新浪科技)

最新快讯搜索

st 小红书 半导体 涨停 中信证券 AI 阿里 无人潜水器 汽车 中国 新能源 股票交易异常波动 deepseek 润和软件 A股 新能源汽车 降息 腾讯控股 资产重组 比特币 越南 特朗普 大选 上交所 北汽蓝谷 OpenAI 悟空 存量房贷 黑神话 三元电池 黑神话:悟空 以旧换新 茅台 电池回收 泸州老窖 今日收评 存量房贷下调 智能驾驶 贝莱德 美国大选 贵州茅台 投票 三连板 中芯国际 曲江文旅 茅台酒价 孚能科技 蔚来 破净 中国平安 中信建投 四连板 上证指数 AI出海 寻呼机 弹匣电池 破净发 AI模型公司 白马股 存量房贷利率 理想汽车 宁德时代 房贷 稀土 3000点 广交会 绝地求生 连板股 动力电池 江淮汽车 哪吒汽车 瑞幸咖啡 蜀道装备 欣旺达