ESSAY
AI 的胃口:从一次回答到全球电网
“你刚才问 ChatGPT 的那个问题,花了多少电?大约 0.3 瓦时。我不打算让你松这口气。“
核心观点 / 起源
你刚才问 ChatGPT 的那个问题,花了多少电?
大约 0.3 瓦时。
换个你能摸到的说法:一盏普通 LED 灯泡亮 30 秒的电力。或者你手机充 30 秒电。或者你烧一壶水所用电量的两千分之一。
你大概松了一口气——0.3 瓦时,这也太少了。确实,早期那些耸人听闻的标题(“一次 ChatGPT 搜索耗电是 Google 搜索的 10 倍!“)已经被实验室的实测数据推翻。当 H100 GPU 集群上跑着批处理、推理引擎做着实时的算子融合和 KV 缓存优化,一次短文本回答的实际电耗已经压到了 0.3 瓦时附近——和一次 Google 搜索差不多。
但我不打算让你松这口气。
因为接下来我要讲的故事,不是关于 0.3 瓦时,而是关于 0.3 瓦时乘以 100 亿。
细节展开
这 0.3 瓦时只是短文本回答的电费单。如果你让模型”多想几步”——也就是推理模式(reasoning)——事情就完全不一样了。OpenAI 的 o3、DeepSeek 的 R1、Google 的 Gemini Thinking,这些模型不会一次就吐出答案。它们会在内部迭代、自我质疑、探索分支路径,然后把中间过程全扔掉,只给你看最后的结论。
你觉得它只是多想了 3 秒?实际上它可能在内部分叉了 30 条推理链,然后选了最优的那一条。于是电费单从 0.3 瓦时跳到了 4.3 瓦时——13 倍。有些极端推理任务,一次调用的电耗超过 20 瓦时。给一部 iPhone 完整充一次电,模型只是回答了一个数学题。
这就是 AI 能耗的第一条规律:问题的复杂度不是线性增长,但它背后的计算量是乘数级的。
过程 / 推演
一台永不停歇的问答机器
ChatGPT 每天要回答大约 25 亿个问题。
算一下:25 亿 × 0.3 瓦时 = 750 兆瓦时。换算成年,大约 274 吉瓦时——足够 25,000 个美国家庭用一整年。
而这还只是 ChatGPT 一家。Gemini 呢?Claude 呢?Grok 呢?DeepSeek 呢?更不用说 API 调用——数以万计的企业已经把大语言模型嵌入到客服系统、代码编辑器、搜索引擎里。每一次 import openai 背后的一次 API 调用,都是大约 0.3 瓦时。从 0.3 到 750 兆瓦时,只隔了一个”乘以 25 亿”。
训练:你只看到演员,没看到排练室
比推理更隐秘的,是训练。
训练一个 GPT-4 级别的模型,大约需要 50 吉瓦时。50 吉瓦时是什么概念?相当于 5000 个美国家庭全年用电。一盏 LED 灯连续亮 5700 年的电量。
但真正让人震撼的不是这个数字本身,而是一个被精心隐藏的事实:你看到的 50 吉瓦时,只是”最终演出”的账单。排练的账单比这高得多。
2025 年 ICLR 的一篇 Spotlight 论文研究了 AI2 的 OLMo 系列模型的真实全生命周期碳排放。研究者发现:超参数调优、失败实验、架构探索、消融研究——这些”排练”消耗的能源,占了总能耗的 50%。 到了 OLMo 3,这个比例飙到了 82%。
说人话:你在大街上看到的 Model Y,每造一辆用了 X 度电。但在它背后,特斯拉的工程师用了 4 倍于 X 的电力去设计、试错、撞毁原型、跑风洞。AI 训练同理。业界公布的训练能耗,只是最终那一次成功运行的账单——之前几百次失败的”预训练”、上千组被放弃的消融实验,全被扫进了看不见的地毯下面。
每家 AI 公司在汇报能耗时,都只报了上台演出的电费。排练室的灯烧了多少小时——他们不说。
而”排练室”的门槛还在惊人地上升。2012 年,AlexNet 用 2 张 GTX 580 显卡就拿了 ImageNet 冠军。2024 年,马斯克的 xAI 建 Colossus 训练集群,用了 10 万张 H100。从 2 张到 10 万张——12 年间,五万倍。
GPU 的胃口:省油但排量更大的 SUV
如果要给这个故事找一个物理载体,那就是 GPU。
从 V100(2017 年,250W)到 A100(2020,400W),到 H100(2022,700W),再到 B200(2024,约 1200W)——每一代都比上一代”省油”(每瓦性能更高),但排量也更大。它像一台不断升级的 SUV:发动机效率提高了 20%,但你把排量从 2.0T 换成了 5.0 V8。每升油耗确实更低,总油耗翻了一倍。
而且每瓦计算功耗都需要额外的冷却和电源转换损耗。这个损耗率叫 PUE(Power Usage Effectiveness)。Google 能做到 1.09——GPU 吃 100 瓦,冷却只多吃 9 瓦。很牛。但行业平均是 1.56,中国很多数据中心更高。
更隐蔽的是隐含碳:从 12nm(V100)到 4nm(B200),每平方厘米晶片面积的隐含碳从 1.2 公斤 CO₂ 升到了 2.1 公斤——因为更精密的光刻需要更多步骤、更苛刻的环境控制。一张 B200 在台积电出厂前,碳足迹就已经相当于一辆燃油车跑几百公里。而它的使命,是插进服务器,日夜不停地替人类回答问题。
杰文斯悖论:效率的诅咒
1865 年,英国经济学家威廉·杰文斯发现了一件反直觉的事:瓦特改良蒸汽机后,英国的煤炭消耗不但没有减少,反而暴增了。
逻辑链:更高效的蒸汽机 → 单台用煤量下降 → 蒸汽机变得便宜好用 → 被用到更多地方 → 总煤耗飙升。
160 年后,这一定律在 AI 产业精确重演。
2025 年 1 月,DeepSeek 发布 R1 模型,号称训练成本只有 OpenAI 同级模型的十分之一。市场反应是什么?所有科技巨头的资本支出不降反升。 2026 年,全球超大规模云厂商的资本支出预计达到 6020 亿美元,同比增长 36%。DeepSeek 证明了”高效 AI 是可能的”,结果是——更多人觉得自己也可以入场了,更多企业决定”我们也得有自己的大模型”,更多应用场景被发现和铺开。
这就是杰文斯的诅咒:在 AI 赛道上,每一轮效率提升都不是为了省电,而是为了用同样的电跑更大的模型。
四项独立学术研究加上 IEA 的 2026 年度报告得出了同一个结论:单位 AI 任务能效每年提升 20-50%,但总能耗增长更快。Google 自己的数据是最诚实的证词:2024 年,谷歌全球排放达 1520 万吨 CO₂,比 2019 年高出 54%——尽管 PUE 已做到世界最低的 1.09。
效率在狂奔,排放也在狂奔。方向相同,速度不同——后者更快。
下一张账单正在打印
前面的所有数据,都基于文字模型。但 2025 年下半年,主战场正在从文字转向视频。Sora、Veo、Kling 一次推理不是 0.3 瓦时,而是把数百帧画面一帧帧跑出来。一个保守的方向性判断:比文字高 2-3 个数量级。
再加上 Agent 模式:一个”帮我规划下周东京旅行”的请求,可能触发 50-100 次内部推理循环。
把这些乘在一起:更多用户 × 更多 Agent 任务 × 视频生成 × 更长的推理链 = ?
IEA 的基准预测:全球数据中心用电从 2025 年 485 太瓦时,翻倍到 2030 年 950 太瓦时。AI 专项用电 2025 年同比涨了 50%,预计 2030 年翻三倍。而注意——这还只是基准预测。不同研究的 2030 年估计值差异可达 40 倍。
一点补充
| 数据维度 | 数字 | 来源 |
|---|---|---|
| 单次短文本查询 | 0.3 Wh | Joule/Cell Press, 2026.4 |
| ChatGPT 日查询量 | ~25 亿次 | 行业估计 |
| GPT-4 级训练能耗 | ~50 GWh | Epoch AI / 学术估计 |
| GPU 功耗增长 | 250W → 1200W | NVIDIA 规格表 |
| 开发隐形成本占比 | 50-82% | OLMo 系列, ICLR 2025 |
| 2030 全球数据中心用电 | ~950 TWh | IEA, 2026.4 |
| 2026 超大规模资本支出 | ~6020 亿美元 (+36% YoY) | 行业汇总 |
| Google 排放增长 (vs 2019) | +54% | Google 2025 环境报告 |
结语 / 反思
这篇文章的目的不是让你恐惧使用 AI。正相反,有意识地使用 AI 比不知道你的问题去了哪要好。
但你需要知道这笔账——因为目前几乎没人告诉你。
你需要知道:每次问 ChatGPT 一个简单问题,背后可能是一台 H100 在你不知道的某处烧掉了 0.3 瓦时的电。你需要知道:这个数字乘以 100 亿次,再乘以正在快速增长的视频和 Agent 负载,正在把 AI 推成世界上增长最快的电力消费者之一。你需要知道:每一次”这个模型更高效了”的新闻,背后很可能启动的是一次更大规模的投资、一张更长的电费单。
这是 21 世纪最经典的杰文斯悖论案例:我们正在一边建太阳能电站,一边造越来越能吃的机器。
下一篇,我们聊聊这张账单的地理分布。同一台 GPU,插在华盛顿州的水电站旁边,和插在内蒙古的煤电厂旁边,跑出来的碳足迹可以差 10 倍以上。你用的 AI 服务——GPT、Claude、Gemini——它到底接在哪根电线上?