作者:电子创新网张国斌
近日,AMD 宣布收购专注于 AI 内存优化技术的公司 MEXT,试图通过预测式内存技术降低数据中心整体拥有成本(TCO),并在新一轮内存技术竞赛中取得先机。 在 Agentic AI 等新一代应用推动下,数据中心内存需求持续飙升,如何在保证性能的前提下降低成本、提升资源利用率,正成为各大云厂商与芯片公司的共同难题。
根据 AMD 公布的信息,MEXT 的核心技术是利用 AI 驱动的预测式内存管理,将闪存“伪装”成更接近 DRAM 行为的存储资源,从而在尽量保持性能与能效的前提下,显著扩展系统可用内存容量。 这一思路试图打破传统“DRAM 容量决定上限”的架构瓶颈,让更多数据常驻在类内存介质中,减少高成本 DRAM 的堆叠依赖。
AMD 表示,通过整合 MEXT 技术,数据中心客户有望在三个层面直接受益:一是基础设施成本下降,即在同等或相近性能下使用更具性价比的存储介质;二是资源利用率提升,通过更智能的内存访问与数据布局,提高每瓦功耗、每美元成本对应的有效算力;三是通用计算与 AI 工作负载在规模化部署时的弹性进一步增强。 对于正在扩张 AI 集群规模的企业而言,这意味着可以在相同机架、电力与散热条件下承载更大规模的模型与数据。
AMD 强调,现代数据中心架构正在快速演进,而“内存访问”已经成为云与企业环境中普遍存在的关键瓶颈。 随着 AI 模型、数据分析、虚拟化以及高性能计算等工作负载体量不断扩大,内存子系统的成本、延迟与带宽限制正直接决定应用的性能与经济性。 在这一背景下,谁能在内存层面给出更具优势的解决方案,谁就更可能在下一阶段的 AI 基础设施竞争中占据有利位置。
通过此次收购,AMD 为其数据中心产品线进一步补齐了“全栈”布局中与内存紧密相关的一环,从 x86 与加速芯片到系统级平台,再到 AI 软件生态,叠加 MEXT 的内存优化能力,AMD 认为有望为企业客户提供更具差异化的一体化算力方案。 官方表述称,MEXT 的预测式内存技术将被整合进 AMD 数据中心组合产品中,帮助用户在现有基础设施投资上“挖掘更多价值”,并加速 AI 部署节奏。
实际上,我们看到,AI算力战争,最先“崩”的不是GPU,而是——内存。就在所有人还在疯狂抢GPU、拼算力、卷TFLOPS的时候,AMD突然出手,收购了这家几乎没人听过的小公司:MEXT。很多人第一反应是:“又一笔常规补强?”
但如果你看懂AI基础设施的底层逻辑,就会意识到——这不是补强,这是改规则。
一、一个被忽略的真相:GPU其实一直在“饿着”
今天的数据中心里,最荒诞的一幕是:GPU在等数据算力在空转钱在燃烧,问题不在算力,而在“喂不饱”。大模型推理时代,一个残酷现实已经摆在台面上:不是算力不够,而是内存跟不上。
KV Cache、长上下文、多并发推理……这些东西不吃算力,专吃内存。
于是你会看到:
HBM越来越贵
DRAM越来越紧
GPU利用率却越来越低
一句话总结:AI的真正瓶颈,已经从“算力墙”,变成“内存墙”。
二、MEXT在干一件“反常识”的事
MEXT做的事情,如果用一句话说清楚:让SSD,看起来像内存。听起来很离谱,但本质是:用AI预测数据访问、提前把数据“搬到该在的地方”、把慢存储“伪装”成快内存,结果是什么?内存容量等效提升2–4倍、成本大幅下降、 GPU不再“空等数据”!这件事的杀伤力在于:它不是提升性能,而是提升“有效算力”。
三、AMD真正想干的,不是追NVIDIA
很多人喜欢把这笔收购简单理解为: AMD在补生态,对抗NVIDIA但这其实是低估了这件事。
我们把两条路线放在一起看:NVIDIA的逻辑是更强GPU、更高带宽、更重硬件体系,其本质是用硬件碾压一切,而AMD正在走的路GPU + CPU:系统调度、内存优化(MEXT),本质变成了用系统效率对抗硬件堆料,这背后其实是一个更深层的判断:当算力差距缩小,胜负不再取决于芯片,而取决于系统。
四、更危险的信号:AI算力规则正在被重写
过去十年,行业默认一个公式:AI能力 = GPU数量 × 单卡性能,但现在,这个公式正在失效。
新的公式正在出现:AI能力 = 算力 × 内存效率 × 调度能力
而MEXT,正好卡在中间这一刀:内存效率,这意味着什么?意味着未来的竞争,不再是谁的GPU更多,而是谁能把每一份资源榨干!
五、真正的颠覆:让“便宜资源”变得有价值
MEXT最狠的一点,不是优化,而是“重定价”。过去:DRAM = 高性能 = 高价格,SSD = 低性能 = 低价格,现在它做的事情是:把低价资源,变成“接近高价资源”的效果,这会带来一个连锁反应:数据中心成本结构被改写、GPU需求曲线被改变、AI部署门槛被降低,甚至可以大胆一点说:这类技术,是在“偷走”一部分GPU需求。
六、为什么是现在?
因为AI正在发生一个关键转折:从“训练时代”,进入“推理时代”,训练拼的是极限算力,但推理拼的是:成本、效率和规模,而这三件事的核心,不是GPU,而是内存 + 调度 + 系统设计,所以,真正的战争,才刚刚开始,如果你只把这次收购看成一次技术补强,你会错过真正的信号。
这件事真正说明的是:AI基础设施的竞争,正在从“芯片战争”,升级为“系统战争”。
而更激进一点的判断是:未来淘汰GPU厂商的,不是更强的GPU,而是更高效的系统。
如果说过去十年是“GPU战争”,那么接下来十年,将是:算力利用率战争。
最后一句话,留给所有还在疯狂堆算力的人:决定AI上限的,不再是你有多少算力,而是你浪费了多少算力。
注:本文为原创文章,未经作者授权严禁转载或部分摘录切割使用,否则我们将保留侵权追诉的权利