GitHub Copilot 的定价转型正在引发 AI 行业的连锁反应,一场关于 AI 商业模式可持续性的深层争论由此浮出水面。 随着按量计费取代固定订阅,用户账单骤然飙升,而 Coinbase、Hugging Face 等科技巨头的掌舵者正在给出截然不同的应对路径,廉价模型的崛起,或将从根本上重塑 AI 算力的成本格局。
6 月 1 日,微软旗下 GitHub Copilot 正式将计费模式从按请求次数收费切换为按 Token 用量计费,部分重度用户的月度账单预计从此前的数十美元骤升至数百美元。 这一变化迅速在社交媒体引发强烈反弹,有用户晒出内部成本估算截图,显示其月度费用将从 44.68 美元跳升至 754.29 美元,另有用户预计账单将高达 847 美元。
这场定价风波的背后,是 AI 行业长期以来以补贴换增长模式的集中爆发。 Coinbase首席执行官Brian Armstrong对此作出回应,预判80%的AI工作负载将在12至18个月内迁移至成本低99%的模型,能源与算力将成为真正的瓶颈所在。
Hugging Face 首席执行官 Clement Delangue 则援引斯坦福大学研究数据,为本地化、开源小模型的大规模替代提供了实证支撑。
GitHub Copilot 的定价调整并非突然之举。 今年4月,GitHub产品长Mario Rodriguez已公开表示,随着智能体AI的兴起,现行定价模式「已不再可持续」——一次简短的对话提问与一次耗时数小时的自主编程任务,此前对用户收取相同费用,而 GitHub 一直在背后吸收不断攀升的推理成本。
新政策于6月1日正式生效。 在新计费体系下,用量成本按所使用的 AI 模型及消耗的 Token 数量折算为 AI 积分,每个积分等值 0.01 美元。 订阅用户获得固定基础积分配额,并根据订阅层级获得额外弹性积分。 由于前沿 AI 模型通常消耗更多 Token,不同模型之间的实际成本差异悬殊。
用户的反应迅速而激烈。 在 GitHub 的 Reddit 社群,一名自称从首日起便订阅 Copilot Pro + 的用户写道:「每月 39 美元感觉已经很贵了,但还算值得。 现在换成这套 AI 积分机制,我算了一下,下个月预计账单:847 美元。」多名用户将这一变化比作Uber的商业路径——以超低价格培养用户依赖,待用户形成习惯后再大幅提价。
Gartner 分析师Arun Chandrasekaran接受Business Insider采访时表示,Copilot的案例可能只是一个早期样本,预计随着高级推理模型和智能体工作流推动推理端算力消耗大幅上升,更多企业将转向按Token或按用量计费模式。
补贴模式的系统性风险
这场定价风波折射出 AI 行业更深层的结构性矛盾。 投资人Totmy Shaughnessy在社交媒体发文,系统梳理了他所认为的「AI 最显而易见的崩溃路径」。
他指出,按席位订阅的固定费用长期以来被大幅补贴,远低于重度使用的实际成本。 一旦企业出于数据保护、合规审批等需求转向API调用,便会直面按量计费的真实价格,而实际消耗速度往往远超此前预期。 他援引多个案例佐证这一趋势,包括Uber在2026年将全年AI预算在四个月内耗尽。
Shaughnessy 进一步指出,当前 AI 大厂的利润率已深度为负——据报道 OpenAI 的利润率接近负 122%——这意味着其完全依赖外部资本来购买 GPU、训练模型并持续补贴用量。 他认为,一旦投资者对回报预期失去信心,整个资本流动将面临逆转风险。
不过,他也提示了这一逻辑的边界:若 AI 真正催生新药研发或全新商业形态,用户对高价 AI 服务的支付意愿将大幅提升,届时上述压力或将缓解。
Coinbase 执行长:廉价模型将主导未来
面对算力成本的持续攀升,Coinbase执行长Brian Armstrong给出了他的判断框架。 他认为,对智能的需求近乎无限,但市场将快速分化:80%的工作负载将在12至18个月内迁移至成本低99%的模型,剩余20%对智能上限有极致要求的任务——如科学突破、高层级编排智能体——仍将运行在最新一代前沿模型上。
Armstrong 将这一趋势模拟于消费电子市场:购买顶规 MacBook 或游戏 PC 的用户始终是少数,而 AI 领域的价格下降速度甚至比摩尔定律更快。 他由此得出结论,未来真正的制约因素将是能源与算力,而非模型能力本身。
Armstrong 还披露了 Coinbase 的内部实践:公司正积极推进提示词路由策略,将请求分配至成本更低的模型,在部分场景下已实现总成本基本持平,而 Token 用量仍在指数级增长。
Hugging Face执行长Clement Delangue援引斯坦福大学研究数据,为廉价模型的替代潜力提供了量化依据:本地模型在真实世界的对话与推理查询中的准确率已从2023年的23.2%跃升至71.3%,且成本与能耗均仅为前沿API的一小部分。
Delangue 据此提出「多模型未来」的判断:对于大多数工作负载,本地化、开源、小型且廉价的模型将成为主流选择; 只有在别无选择时,才需要调用前沿 API。
Shaughnessy 的分析与此形成呼应。 他指出,DeepSeek V4 在 SWE-bench 编程基准测试中的表现与 Anthropic Claude Opus 相近,但价格约为后者的三十分之一; 最廉价的开源模型价格甚至低至约百分之一。 他认为,中国实验室持续开源前沿级模型,使推理服务提供商得以免费获取最核心的模型成本,这正在从根本上压制闭源 AI 大厂的定价能力与利润空间。













