高盛5月5日发布最新研究报告《解码智能体经济》(Decoding the Agentic Economy),提出AI产业正迈向一个关键转折点。 报告认为,随着AI智能体(agentic AI)逐渐从实验阶段进入企业与消费市场,全球token需求将迎来爆炸性增长,同时整个科技产业的利润结构也将被重新改写。
高盛预测,到2030年,全球每月 token 处理量将达 120 千万亿个,约为 2026 年现有算力需求的 24 倍; 若企业端智能体全面普及,到2040年需求更可能扩大至55倍。
不同于一般从市场规模反推需求的估算方式,高盛科技研究团队此次采取自下而上的建模方法,实际模拟AI智能体执行任务的完整流程,逐步计算 token 消耗,再乘以使用频率与采用人数,建立需求模型。
高盛指出,AI产业过去两年始终存在「使用量增加、成本同步飙升」的矛盾。 由于每处理一个 token 都需要消耗大量算力,云端与模型供应商的毛利率长期承压。 然而,这种局面正在2026年出现重大变化。
报告显示,主流大型语言模型的 token 价格过去每年下降约 40%,但目前价格跌幅已逐渐趋缓,甚至部分服务开始小幅涨价; 另一方面,算力成本仍持续快速下滑,包括英伟达(NVDA-US)、超微AMD(AMD-US)、Alphabet旗下Google TPU,以及亚马逊(AMZN-US)Trainium等芯片与加速器平台,均推动AI运算成本以每年60%至70%的速度下降。
高盛认为,当 token 定价趋稳、成本却持续下降时,AI 产业的利润空间将迅速扩大。 报告指出,2026年上半年将是AI产业从「烧钱扩张期」转向「盈利改善期」的重要拐点。
高盛强调,真正带动 token 需求暴增的核心,不是现有聊天机器人,而是 AI 智能体。
目前大部分消费者使用ChatGPT、Claude或Gemini等AI服务时,通常只是提出问题、取得答案后结束对话,平均一次互动约消耗1700个token。
但 AI 智能体不同。 它们会持续在背景运作,自动监控邮件、日历、工作任务与系统资料,并主动执行工作流程。
高盛模拟的一套邮件管理智能体,每日需消耗约9.1万个输入token与2.28万个输出 token,单日成本约0.055美元,token消耗量比一般聊天互动高出近50倍。
原因在于智能体需要执行多阶段推理,包括邮件扫描、分类、信息提取、内容生成、语气检查、合规验证、安排寄送与记忆更新等流程,每一步都会消耗 token。
此外,企业级智能体还涉及大量循环验证与错误修正机制,使 token 需求呈现非线性成长。
例如高盛模拟的程序开发智能体,每日需处理约627万个输入 token 与 82 万个输出 token,API 成本约 13 美元。 虽然数字看似庞大,但相较于软体工程师的人力成本,已具备相当竞争力。
高盛将消费端 AI 应用分为三个层级。 第一层是聊天机器人; 第二层是嵌入式 AI 工具,例如搜索摘要、邮件助理等; 第三层则是永远在线的自主智能体。
报告预估,到2030年,全球每日AI查询量将从2025年的50亿次成长至230亿次,其中约30%将流向各类智能体,而非传统搜索引擎或聊天机器人。
高盛认为,这将导致搜寻市场出现重大结构变化。 传统搜寻在总查询量中的占比,将从2025年的68%下降至2030年的36%,取而代之的是AI原生应用与大型语言模型驱动的服务。
企业端市场则被视为最大成长引擎。
高盛估算,到2040年高峰期,企业智能体将覆盖全球37%的知识工作者,带动每月278千万亿个token需求,占全球总token消耗量超过70%。
由于企业工作流要求高度精准、可审计与可追溯,因此企业智能体的 token 密度远高于消费端应用。
例如财务分析、数据输入、客服与医疗记录管理等场景,都需要大量验证、工具调用、多模态资料分析与合规检查。
高盛指出,不同工作类型的成本结构差异极大。 程序开发智能体虽然 token 消耗量高,但因主要处理文字,成本相对低廉; 相反地,涉及即时语音处理的客服智能体,虽然 token 量较少,但单日成本可能高达 92 美元。
资料输入类智能体则因需要大量结构化数据验证,每日 token 消耗可达 2513 万个,成本约 60 美元。
高盛认为,文字密集、工作流程标准化、工具链成熟的职位,将率先被智能体渗透; 而涉及语音、多系统整合与高责任追溯需求的工作,导入速度则相对较慢。
报告也研究了1800年至2000年间、涵盖101种技术与161个国家的技术采用历史资料,发现技术普及速度差异极大。 铁路与固定电话花费超过百年才达渗透高峰,但ATM与有线电视不到20年即快速普及,中位数约为29年。
高盛预测,企业AI智能体的采用曲线将呈S型发展,2030年前后进入快速渗透阶段,约15年达到高峰,快于历史平均速度。
不过高盛也提醒,数据治理、系统整合、内部流程改造与监管合规等问题,仍将是AI智能体全面普及的重要阻力。 许多企业可能长期停留在试点阶段,难以真正大规模部署。
在投资建议方面,高盛最看好的半导体公司包括英伟达(NVDA-US)、博通(AVGO-US)与超威AMD(AMD-US)。
高盛给予英伟达250美元目标价,认为其在AI训练与推理领域仍维持领先地位; 博通目标价480美元,主要受惠大型云端业者转向客制化AI芯片; AMD目标价450美元,高盛看好其数据中心GPU与企业CPU业务同步受惠。
云与互联网领域方面,高盛偏好亚马逊(AMZN-US)、Alphabet (GOOGL-US) 与Meta Platforms (META-US)。
其中亚马逊AWS第一季营收年增28%,手握3640亿美元订单积压与额外1000亿美元新合约; Google Cloud第一季营收年增 63%,未执行合约积压增至 4600 亿美元; Meta 则受惠 AI 广告工具推动广告变现效率提升。
软件与 IT 服务领域,高盛则看好微软 (MSFT-US)、Cloudflare (NET-US) 与埃森哲 (ACN-US)。
高盛指出,微软 Copilot 企业版使用率持续改善,Microsoft 365 升级循环可能加速; Cloudflare 则在边缘 AI 推理架构具备优势; 埃森哲则有望受惠企业大规模导入 AI 时所需的大量系统整合与流程改造需求。
不过,高盛也警告,纯文字聊天机器人市场竞争正迅速加剧,开源模型不断压低价格,商业模型的定价能力正在削弱。
报告认为,只有高 token 密度、高技术门槛、难以被开源模型取代的智能体工作负载,才能真正建立长期利润扩张能力
此外,目前企业端 AI 部署大多仍停留在「有人监督的半自动化」阶段,距离真正完全自主运行仍有相当距离。 高盛坦言,从现阶段发展到2030年的智能体全面落地,中间仍需经历大量组织与流程层面的深度变革,而这类变革往往比技术演进更缓慢。













