Google 周二 (23 日) 盘后发布新一代压缩算法「TurboQuant」,可能颠覆存储器需求结构,成为引爆周三 (25 日) 内存族群卖压的关键因素。
Google Research 周二盘后发布的新技术「TurboQuant」。 该算法针对大型语言模型(LLM)推论过程中的存储器瓶颈进行优化,可将内存使用量降低约6倍,并在相同GPU配置下提升最高8倍运算速度,同时维持零准确度损失。
TurboQuant 主要针对 GPU 中的「KV cache」进行压缩。 该区块用于储存模型推论过程中的暂存数据,随着 AI 上下文长度增加,其内存需求急速膨胀,已成为主要瓶颈。
Google 表示,TurboQuant 通过新型量化方式,移除传统压缩所需的额外参数,提升效率并降低内存负担。 在 Gemma 与 Mistral 等模型测试中,即使在高压缩情境下,仍能维持完整效能。
此消息迅速引发市场关注,Cloudflare首席执行官 Matthew Prince 更将其形容为「Google 的 DeepSeek 时刻」,意指 AI 技术效率出现重大突破。
华尔街分析指出,若该技术成功落地,意味AI模型在相同运算需求下,所需内存资源将大幅下降,可能削弱原本因AI热潮而大幅提升的DRAM与NAND Flash需求。
此前,存储器价格曾因供给紧张与 AI 应用爆发而大幅上涨,成为推升相关个股的重要动能。
受此消息冲击,资金急速撤出记忆体族群,美光(MU-US)周三跌幅3.40%,收382.09美元。 威腾电子(WDC-US)收黑1.63%,收296.14美元。 SanDisk(SNDK-US)跌幅超3%,收677.86美元。 希捷科技(STX-US)下滑2.59%,收413.22美元。
高盛科技专家Peter Callahan指出,市场虽未出现极大恐慌,但投资人对记忆体股近期走势进行合理性检验。 其中,美光过去5个交易日相对费城半导体指数(SOX-US)落后约20%,创2011年以来最大幅度的短期相对落后,即便公司甫公布强劲财报,股价仍持续承压。
不过,市场也关注该技术仍处于研究阶段,尚未在大规模商业环境验证,且仅适用于推论过程的暂存内存,并不涉及模型权重本身。
法人指出,未来若出现更多类似技术,内存需求成长预期可能下修,短期内族群波动恐持续扩大。













