• 验证码登录/注册
  • 密码登录

登录失败,用户名或者密码错误


备注:已注册帐号可切换到密码登录,初始密码为123456。
收不到短信验证码请直接输入:9999
登录

首页  > 快讯

OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性

8月前
【OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性】近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

最新快讯搜索

AI 新能源汽车 特朗普 新能源 deepseek st 中信证券 大选 中国 汽车 比特币 A股 降息 资产重组 投票 小红书 悟空 蔚来 江淮汽车 贵州茅台 半导体 存量房贷利率 涨停 OpenAI 越南 茅台 电池回收 三连板 连板股 理想汽车 宁德时代 上证指数 中信建投 房贷 上交所 阿里 贝莱德 智能驾驶 中国平安 存量房贷 泸州老窖 腾讯控股 绝地求生 股票交易异常波动 寻呼机 广交会 破净 蜀道装备 稀土 黑神话:悟空 瑞幸咖啡 哪吒汽车 破净发 三元电池 中芯国际 存量房贷下调 北汽蓝谷 白马股 3000点 以旧换新 茅台酒价 无人潜水器 黑神话 四连板 动力电池 今日收评 弹匣电池 AI模型公司 美国大选 曲江文旅 欣旺达 AI出海 孚能科技 润和软件