• 验证码登录/注册
  • 密码登录

登录失败,用户名或者密码错误


备注:已注册帐号可切换到密码登录,初始密码为123456。
收不到短信验证码请直接输入:9999
登录

首页  > 快讯

突破算力限制 Meta开源“记忆层”,重塑Transformer架构大模型

10月前
【突破算力限制 Meta开源“记忆层”,重塑Transformer架构大模型】 扎克伯格旗下Meta Platforms分享了一个创新研究——Memory layers(记忆层)。目前,Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。“记忆层”提出了新的高效查询机制替代了传统的查询方法,通过比较查询键与两个较小集合中的键,可以快速找到最相关的键,而无需遍历模型的整个记忆层。这也就是说,可以在不增加算力的情况下显著增加大模型的参数。例如,研究人员在仅有1.3亿参数的模型中添加了128亿额外的记忆参数,其性能与Meta开源的Llama 2- 70相当,而算力却比它低了10倍左右。

最新快讯搜索

中国 大选 房贷 美国大选 阿里 AI 新能源 股票交易异常波动 st A股 理想汽车 贵州茅台 悟空 存量房贷利率 半导体 蔚来 特朗普 汽车 上交所 deepseek 中芯国际 破净 涨停 三连板 比特币 黑神话:悟空 降息 OpenAI 资产重组 动力电池 中信证券 中信建投 上证指数 稀土 茅台 电池回收 存量房贷 新能源汽车 以旧换新 泸州老窖 宁德时代 江淮汽车 欣旺达 北汽蓝谷 智能驾驶 寻呼机 贝莱德 越南 弹匣电池 小红书 茅台酒价 连板股 哪吒汽车 AI模型公司 中国平安 三元电池 3000点 绝地求生 蜀道装备 存量房贷下调 腾讯控股 AI出海 孚能科技 投票 破净发 广交会 曲江文旅 润和软件 白马股 瑞幸咖啡 黑神话 今日收评 四连板 无人潜水器