摩根士丹利最新研究报告指出,随着大语言模型(LLM)的红利逐渐见顶,人工智能的下一场革命将发生在「世界模型」(World Model)。
这份由 Adam Jonas 团队撰写的报告明确表示,AI 正从单纯理解文字的「数字智能」跨越到理解物理规律的「实体智能」,这将是开启下一个兆级产业赛道。
报告深度剖析,尽管 LLM 在办公与数字创作领域表现优异,但其缺乏「具身认知」的弱点,使其无法理解物理惯性、三维空间与因果演化。
世界模型则被誉为 AI 的「想像引擎」,具备空间理解、物理建模、时序预测及互动决策四大核心能力,能让 AI 在采取行动前先于虚拟空间进行推演,真正实现「先思考、后行动」。 目前全球科技巨头如谷歌(GOOGL-US)、Meta(META-US)、微软(MSFT-US)、特斯拉(TSLA-US)与英伟达(NVDA-US)正展开激烈的技术军备竞赛,每年砸下超过百亿美元研发。
技术路线已演进出交互式动作条件模型、一致性 3D 生成器、抽象表示模型等多元路径,其中 Meta 的 V-JEPA 2 与微软的 Muse 已成为指标性模型,能在极短的时间内透过影片学习完成对复杂机械臂的精准控制或生成高度稳定的游戏场景。
世界模型的应用场景已涵盖自动驾驶、机器人、工业自动化与数字设计等领域。 例如 Waymo 已借此完成数十亿英里的虚拟路测,大幅降低实测成本; 设计师则能透过简单提示快速产出具备物理一致性的 3D 方案。
尽管目前仍面临算力鸿沟、数据稀缺与时序一致性等六大技术挑战,但摩根士丹利预测,到2035年,由世界模型赋能的产业规模将达到惊人的10万亿美元。
在投资逻辑上,算力提供商如英伟达、AMD(AMD-US)以及模拟平台与自动驾驶解决方案商将成为核心受益者。 反之,若企业仅专注于缺乏空间与物理能力的纯语言模型,将可能在这一波「物理智能」的浪潮中被淘汰。
世界模型不仅是连接数字与物理世界的基础设施,更是通往通用人工智能(AGI)的必经之路,其长期价值已不言而喻。













