• 登录/注册

登录失败,用户名或者密码错误


登录

首页  > 快讯

阿里千问3发布并开源,参数仅为DeepSeek-R1三分之一

8月前
【阿里千问3发布并开源,参数仅为DeepSeek-R1三分之一】阿里巴巴开源了新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,宣布成本大幅下降,性能超越R1、OpenAI-o1等领先模型。千问3是一个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,极大节省了算力消耗。据了解,千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T tokens,并在后训练阶段经过多轮强化学习,将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。(新浪科技)

最新快讯搜索

汽车 中国平安 中芯国际 房贷 上交所 存量房贷利率 贵州茅台 半导体 腾讯控股 新能源汽车 黑神话 特朗普 江淮汽车 新能源 中国 大选 OpenAI 资产重组 宁德时代 中信证券 deepseek 茅台 上证指数 A股 涨停 智能驾驶 降息 动力电池 st 蔚来 AI 四连板 北汽蓝谷 瑞幸咖啡 黑神话:悟空 美国大选 电池回收 广交会 贝莱德 泸州老窖 阿里 稀土 中信建投 越南 以旧换新 比特币 蜀道装备 存量房贷下调 绝地求生 理想汽车 投票 股票交易异常波动 破净 哪吒汽车 三连板 悟空 孚能科技 白马股 存量房贷 润和软件 茅台酒价 连板股 小红书 欣旺达 AI出海 三元电池 无人潜水器 AI模型公司 今日收评 弹匣电池 3000点 破净发 寻呼机 曲江文旅