大模型能源消耗问题引发广泛讨论之际,谷歌以实测数据作出回应。
根据实测中位数显示:一次Gemini查询仅消耗0.24瓦时电力(相当于微波炉运行1秒),产生0.03克二氧化碳当量排放(低于人类单次排气量),并消耗约5滴水量。
谷歌首席科学家Jeff Dean强调:”实际能耗显著低于公众普遍认知水平”。
过去一年间,通过持续优化模型架构并扩大清洁能源应用比例,Gemini推理任务的能源消耗较初始版本降低97%,碳排放减少98%,同时服务响应质量获得提升。
谷歌指出当前行业存在计算偏差:若仅以理论峰值测算TPU/GPU功耗,则单次查询能耗仅为0.1瓦时(排放0.02克二氧化碳当量/消耗0.12毫升水)。
但实际运行需综合考量多维能耗要素: 1. 全系统动态功率:包含AI芯片实际利用率带来的能效波动 2. 空闲计算资源:为保障系统高可用性预置的闲置芯片能耗 3. 主机资源消耗:CPU与内存协同工作产生的持续性能耗 4. 数据中心基础设施:冷却系统、配电设备等辅助设施能耗 5. 水资源使用:冷却系统用水量与能源效率呈正相关关系 通过这套全栈优化体系实现突破性能效: – 架构层面采用新一代Transformer框架,在同等质量下较传统语言模型提升10-100倍能效 – 引入混合推理与MoE机制降低计算负载 – 通过精准量化训练(AQT)持续优化模型参数 – 服务端采用推测解码技术与知识蒸馏技术,在保证响应速度的同时减少芯片占用 硬件层面延续TPU定制化路线: – 第三代Ironwood TPU较初代产品能效提升30倍 – XLA编译器与Pathways系统实现软硬协同优化 – 数据中心PUE值稳定在1.09行业领先水平 运营策略方面: – 采用可再生能源覆盖100%运营用电并超额采购20%绿电 – 水循环系统实现平均节水率35%,并在缺水区域实施用水限制 – 基于流域健康评估动态调整冷却方案平衡环境影响 这些综合措施使Gemini在保持高质量服务的同时实现能源足迹最小化。(参考链接如原文)
评论列表 (0条):
加载更多评论 Loading...