每天烧 120 万亿 Token,这是 AI 圈最新的凡尔赛

专属客服号

微信订阅号
120 万亿背后, Token 工厂崛起
今天,火山引擎公布了一个数据,豆包大模型日均 Token 使用量突破 120 万亿。三个月前,这个数字是 60 万亿。2024 年 5 月豆包大模型刚发布的时候,是现在的千分之一。按 3 月国内主流大模型约 2-4 元/百万 Token 的输入价格粗算,这意味着每天有 3 到 5 亿元在 GPU 上燃烧。一年下来就是千亿级支出,相当于烧掉网易一整年的营收(网易 2025 年全年净收入 1126 亿元)。而这只是一家公司、一个模型平台、一天的量。3 月 23 日,中国发展高层论坛 2026 年年会披露:今年 3 月,中国日均 Token 调用量突破 140 万亿,对比 2024 年初的 1000 亿,两年增长超千倍。同月,中国 AI 大模型周 Token 调用量连续三周超越美国。OpenRouter 数据显示,3 月第三周全球 AI 大模型总调用量 20.4 万亿 Token,中国占了 7.359 万亿,全球份额 36%。晚点 LatePost 此前报道过另一个细节:全球日均 Token 消耗量超过 100 万亿的公司,只有三家。OpenAI,Google,字节跳动。更值得琢磨的是,OpenAI 和 Google 的 Token 消耗来自全球市场,而字节跳动的主要来自中国。一个以国内市场为主的平台,Token 吞吐量已经和两个全球化巨头平起平坐。海外部分还在爬坡。火山引擎总裁谭待拆解了增长背后的两个引擎:AI 视频创作爆发,AI 智能体加速普及。这两件事在过去三个月同时「人传人」了。OpenClaw 爆火之后,所有人都在谈 Agent。一只「龙虾」让整个行业意识到:Agent 时代的 Token 消耗逻辑跟聊天时代完全不同。以前你跟大模型对话,一问一答,几百个 Token 就够。现在一个 Agent 要自己思考、规划、调工具、检查结果、出错了还得自我纠正,一个复杂任务跑下来,Token 消耗是普通对话的几十甚至上百倍。火山引擎自己的 ArkClaw 就是个缩影。秒级配对飞书,微信、钉钉、微博也能接入,升级了网盘做端云协同。每一个「自动」的背后,都是 Token 在高速流转。谭待提了一个判断:企业用好 Agent 的关键是三件事,模型、安全、技能(Skills)。模型是 Agent 的大脑,今年 2 月发布的豆包大模型 2.0 在视觉理解上已经跻身全球第一梯队,国内第一。安全是底线,火山引擎刚拿下信通院「智能助理智能体产品可信能力认证」和「安全防护产品有效性认证」双认证,国内唯一。但光有聪明的脑子和安全的笼子还不够,Agent 得有手有脚,能干活。Skills 生态的广度直接决定了 Agent 能力的天花板。这也是当天另一个重磅消息的背景:OpenClaw 创始人 Peter Steinberger 和火山引擎共同宣布,双方共建的 ClawHub 中国镜像站(mirror-cn.clawhub.com)正式启动运营。之前国内开发者用 ClawHub 上的 Skills,经常遇到访问慢、不稳定的问题。镜像站解决的就是这个痛点:高频访问不再卡,Skills 更新能及时同步。Peter Steinberger 甚至在发布现场用「龙虾」生成了一段视频来宣布这个消息。在火山引擎平台上,累计 Token 使用量超过一万亿的企业客户,已经从去年底的 100 家增长到 140 家。三个月多了 40 家「万亿俱乐部」成员。Seedance 2.0 开放公测:企业级视频生成有了「安全底座」同一天,火山引擎还宣布 Seedance 2.0 面向企业用户正式开放 API 公测。Seedance 2.0 是视频生成领域的全球 SOTA 模型,但让它对企业真正可用的,不只是生成质量。火山引擎为它建了一套覆盖全流程的肖像与版权安全标准,从输入素材的合规校验,到生成过程中的肖像权保护,再到输出内容的版权风险拦截。Deepfake、侵权这些让企业法务部夜不能寐的问题,在模型层就做了拦截。这套安全机制覆盖视频生成涉及的各种模态和创作前后的全部环节。说白了,火山引擎选择在模型最火的时候,先把安全门焊死,再把 API 钥匙交给企业。对企业来说,这解决的是一个很现实的问题:敢用。 品牌广告、电商视频、营销物料,这些场景对版权和肖像的敏感度极高。没有安全兜底,性能再强企业也不敢大规模接入。谭待描述了企业 Agent 建设的两条路径:敏态和稳态。 敏态 Agent 像 ArkClaw,是员工的「创新试验场」,让每个 HR 变成更好的 HR,让每个分析师变成更好的分析师。稳态 Agent 则把验证过的最佳实践流程化、规模化,嵌进合同交易、生产管理这些容不得幻觉的场景。两条线不是二选一,是一个飞轮:个体创新在 ArkClaw 里激发,沉淀到 HiAgent 变成组织能力,再通过 Skill 和 API 反哺给每个一线员工。黄仁勋最近定了个调,到 2027 年,全球计算需求将突破 1 万亿美元。他说 Token 是新时代的基础货币,数据中心不再是存储文件的仓库,而是生产 Token 的工厂。火山引擎平台上,累计调用量破万亿的企业客户已经有 140 家。这个数字换个角度理解:AI 的成本结构,正在变成实时计费。并且 Token 的价格,也在暴涨。智谱一个月内两次调价,GLM-5-Turbo 涨 20%,GLM Coding Plan 中国区涨 30%、海外涨超 100%,一季度 API 整体定价较上一代提升 83%。智谱 CEO 张鹏在业绩说明会上说了一句意味深长的话:涨了 83%,调用量还是增长了 400%,供不应求。此外,3 月 18 日同一天,阿里云和百度智能云同时发布涨价公告,AI 算力产品上调 5%-30%,存储涨 30%。腾讯云更早一步,3 月 13 日就调整了智能体开发平台的计费策略,部分模型涨幅超过 4 倍。再往前看,亚马逊 AWS 1 月对机器学习容量块涨价 15%,谷歌云也在同期悄悄调高了数据传输服务价格。国内三大云巨头加上海外两大巨头,在同一个季度里集体涨价,不是偶然。有人算过一笔账:OpenClaw 用户的单日人均 Token 消耗量是传统聊天用户的 20-50 倍。
当海量用户同时把 Agent 跑起来,需求端的增速远远跑在了供给端前面——GPU 产能、电力、数据中心,都需要夯实基础。黄仁勋说 Token 是基础货币。但货币可以存,可以囤,可以等升值。Token 不行。Token 生产出来的那一刻就被消耗掉了,更像电力。 而电力这个词,从来都不只是技术问题,谁控制了发电和输电,谁就拿到了定价权。电网要受监管,通信要发牌照。Token 呢?现在还没有人回答这个问题,但每个厂商都想成为答案。
✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)
转载说明:本文系转载内容,版权归原作者及原出处所有。转载目的在于传递更多行业信息,文章观点仅代表原作者本人,与本平台立场无关。若涉及作品版权问题,请原作者或相关权利人及时与本平台联系,我们将在第一时间核实后移除相关内容。
产业数据库
产业链 200+
产业环节 10000+
产业数据 100亿+